Comment puis-je construire un modèle de langage grand vocabulaire pour CMU Sphinx?
-
24-10-2019 - |
Question
Je voudrais construire un modèle de langage pour CMU Sphinx, mais mon corps a plus de 1000 mots, donc je ne peux pas utiliser l'outil en ligne. Comment puis-je utiliser (les scripts cmuclmtk?) Pour construire mon modèle de langage?
La solution
S'il vous plaît lire le tutoriel
Autres conseils
Pas une tâche triviale. La génération d'un modèle de langage est une tâche beaucoup de temps et de ressources.
Si vous voulez avoir un modèle de langage « bien », vous aurez besoin d'un grand ou très grand corpus de texte pour former un modèle de langue (pensez à l'ordre de grandeur de plusieurs années de textes de journal de Wall Street).
« bon » signifie: si le modèle linguistique sera en mesure de généraliser à partir des données de formation aux données d'entrée nouvelles et inédites
Vous devriez regarder la documentation du Sphinx et les boîtes à outils de modèles de langue HTK.
http://cmusphinx.sourceforge.net/wiki/tutoriallm
Vérifiez également ces deux fils:
bâtiment openears modèle de langage compatible
Vous pouvez prendre un modèle plus général de langue, sur la base d'un plus grand corpus et interpoler votre petit modèle Langue avec elle .. un back-par exemple de modèle de langage ... mais ce n'est pas une tâche triviale.