Comment utiliser le fichier ARPA dans la reconnaissance vocale
-
28-10-2019 - |
Question
J'ai créé un fichier ARPA à partir d'un fichier texte à l'aide de la boîte à outils CMU SLM.
Actuellement, je ne sais pas comment utiliser le fichier ARPA généré dans mon projet au lieu de .lm
et .dic
dossier.
Si quelqu'un le sait, faites-le moi savoir.
La solution
Vous utilisez la probabilité du modèle de langue lorsque vous envisagez le «coût» d'une transition de mots dans la recherche. :-) Mais ce n'est probablement pas ce que vous vouliez entendre.
Votre question est trop ouverte. Quel est votre problème spécifique?
Le dictionnaire et le modèle de langue sont deux éléments distincts - vous ne pouvez pas en convertir l'un dans l'autre.
Le dictionnaire est utilisé pour dire à la recherche quels sont les mots valides et comment ils se rapportent aux phonèmes / à la transcription phonétique.
Le modèle de langue est utilisé lors de la reconnaissance d'un énoncé, en utilisant la probabilité d'un uni-gram, bi-gram, n-gram .. lorsque l'algorithme de recherche envisage une transition de mots.
Éditer:
Chèque:
http://www-speech.sri.com/projects/srilm/manpages/ngram-format.5.html
http://www.ee.ucla.edu/~weichu/htkbook/node243_ct.html
http://www.ling.ohio-state.edu/~bromberg/ngramcount/ngram2fsm.html