HMM para la estimación perspectiva de la imagen en el documento, no puede entender el algoritmo

https://stackoverflow.com/questions/2679939

30-09-2019
|

Pregunta

Este es un periódico, se trata de estimar la perspectiva de la imagen binaria que contiene texto y algunos objetos de ruido o no de texto.

documento PDF

El algoritmo utiliza el modelo de Markov oculto: en realidad dos condiciones T - texto B - backgrouond (es decir, ruido)

Es difícil entender el propio algoritmo. La cuestión es que He leído sobre Modelos Ocultos de Markov y sé que utiliza las probabilidades que deben ser conocidas. Pero en este algoritmo no puedo entender, si utilizan HMM, ¿cómo consiguen esas probabilidades (probabilidad de cambiar el estado de S1 a otro estado, por ejemplo, S2)?

No se encontró nada sobre el entrenamiento también en ese documento. Por lo tanto, si alguien lo entiende, por favor dígame. También es posible el uso de HMM sin conocer las probabilidades de cambio de estado?

EDIT: Puede ser que están utilizando algunas estimaciones, sin conocer los parámetros HMM (probabilidades)

Solución

Tal vez esto es un poco demasiado académica, más relacionada con las matemáticas aplicadas a la programación?

De todos modos: HMM son tradicionalmente entrenados (es decir, aprender el valor de los parámetros del modelo, en este caso las probabilidades) mediante el uso de alguna base de datos de los que ya clasificadas de datos. Vea la Baum Welch algoritmo . Esta división de dos fases: aprendizaje (o entrenamiento) primera (con datos clasificados marcado), (trabajo o real) clasificar después (con datos no clasificados) es típico de muchos algoritmos, y se llama clasificación supervisada .

Por otro lado, a veces no tenemos 'conocida' de datos (clasificadas), por lo que hay que recurrir a no supervisado de clasificación , en el que tratamos de aprender el modelo y clasificar al mismo hora. Esto es mucho más limitado, y por lo general implica hacer muchos symplifications y reducción de los parámetros para el modelo (de modo que no tenemos tantas cosas que aprender). A primera vista, esto parece ser el camino tomado en ese artículo: ellos no consideran un HMM totalmente en general, pero muy restringida, y tratar de encontrar un buen ajuste para el modelo. Pero, de nuevo, que no he leído en serio.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow