Comment utiliser le fichier ARPA dans la reconnaissance vocale

https://stackoverflow.com/questions/7377972

28-10-2019
|

Question

J'ai créé un fichier ARPA à partir d'un fichier texte à l'aide de la boîte à outils CMU SLM.

Actuellement, je ne sais pas comment utiliser le fichier ARPA généré dans mon projet au lieu de .lm et .dic dossier.

Si quelqu'un le sait, faites-le moi savoir.

La solution

Vous utilisez la probabilité du modèle de langue lorsque vous envisagez le «coût» d'une transition de mots dans la recherche. :-) Mais ce n'est probablement pas ce que vous vouliez entendre.

Votre question est trop ouverte. Quel est votre problème spécifique?

Le dictionnaire et le modèle de langue sont deux éléments distincts - vous ne pouvez pas en convertir l'un dans l'autre.

Le dictionnaire est utilisé pour dire à la recherche quels sont les mots valides et comment ils se rapportent aux phonèmes / à la transcription phonétique.

Le modèle de langue est utilisé lors de la reconnaissance d'un énoncé, en utilisant la probabilité d'un uni-gram, bi-gram, n-gram .. lorsque l'algorithme de recherche envisage une transition de mots.

Éditer:

Chèque:

http://www-speech.sri.com/projects/srilm/manpages/ngram-format.5.html

http://www.ee.ucla.edu/~weichu/htkbook/node243_ct.html

http://www.ling.ohio-state.edu/~bromberg/ngramcount/ngram2fsm.html

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow