Pregunta

Entiendo cómo se usa un modelo de Markov oculto en secuencias genómicas, como encontrar un gen. Pero no entiendo cómo crear un modelo de Markov en particular. Quiero decir, ¿cuántos estados debería tener el modelo? ¿Cuántas transiciones posibles? ¿Debería el modelo tener un bucle?

¿Cómo sabrían que su modelo es óptimo?

¿Se imaginan, dicen 10 modelos diferentes, comparan esos 10 modelos y publican los mejores?

¿Fue útil?

Solución

Estoy familiarizado con tres enfoques principales:

  1. A priori. Es posible que sepa que hay cuatro pares de bases para elegir, por lo que permite que el HMM tenga cuatro estados. O es posible que sepa que el inglés tiene 44 fonemas, y así tiene 44 estados para la capa de fonema oculto en un modelo de reconocimiento de voz.

  2. Estimacion. El número de estados a menudo se puede estimar de antemano, tal vez mediante la agrupación simple en las características observadas del HMM. Si la matriz de transición HMM es triangular (que a menudo es el caso en la predicción de la falla), el número de estados determina la forma de la distribución del tiempo total desde el estado de inicio hasta el estado final.

  3. Mejoramiento. Como sugiere, se crean y se crean muchos modelos y se seleccionan el mejor modelo. También se podría adaptar la metodología que aprende el HMM para permitir que el modelo agregue o descarte los estados según sea necesario.

Otros consejos

Un enfoque adicional es probar a los modelos con un número contaminalmente infinito de estados. La respuesta a 'cuántos' surgiría luego promediando las muestras.

http://mlg.eng.cam.ac.uk/zoubin/papers/ihmm.pdf

Licenciado bajo: CC-BY-SA con atribución
scroll top