Domanda

I capire come un Hidden Markov Model è utilizzato in sequenze genomiche, come trovare un gene. Ma io non capisco come a venire con un particolare modello di Markov. Voglio dire, quanti stati il ??modello dovrebbe avere? Quanti possibili transizioni? Se il modello di avere un ciclo?

Come potevano sapere che il loro modello è ottimale?

Non si immagina, dire 10 modelli differenti, di riferimento quei 10 modelli e pubblicare il migliore?

È stato utile?

Soluzione

ho familiarità con tre approcci principali:

  1. A priori. Si potrebbe sapere che ci sono quattro coppie di basi a scegliere, e quindi permettere al HMM di avere quattro stati. Oppure si potrebbe sapere che l'inglese ha 44 fonemi, e così hanno 44 stati per lo strato di fonemi nascosto in un modello di riconoscimento vocale.

  2. Stima. Il numero di stati spesso può essere stimato in precedenza, forse per semplice raggruppamento sulle caratteristiche osservate del HMM. Se la matrice di transizione HMM è triangolare (che è spesso il caso in previsione fallimento), il numero di stati determina la forma della distribuzione del tempo totale dallo stato iniziale allo stato finale.

  3. Optimization. Come lei suggerisce, sia molti modelli vengono creati e in forma e il miglior modello selezionato. Si potrebbe anche adattare la metodologia che apprende la HMM per consentire il modello per aggiungere o stati di scarto, se necessario.

Altri suggerimenti

Un altro approccio è quello di campionare dai modelli con un numero infinito numerabile di stati. La risposta a 'quanti' allora emergere dai media nel corso dei campionatori.

http://mlg.eng.cam.ac.uk/ zoubin / documenti / ihmm.pdf

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top