Question

Je voudrais construire un modèle de langage pour CMU Sphinx, mais mon corps a plus de 1000 mots, donc je ne peux pas utiliser l'outil en ligne. Comment puis-je utiliser (les scripts cmuclmtk?) Pour construire mon modèle de langage?

Était-ce utile?

La solution

S'il vous plaît lire le tutoriel

http://cmusphinx.sourceforge.net/wiki/tutoriallm

Autres conseils

Pas une tâche triviale. La génération d'un modèle de langage est une tâche beaucoup de temps et de ressources.

Si vous voulez avoir un modèle de langage « bien », vous aurez besoin d'un grand ou très grand corpus de texte pour former un modèle de langue (pensez à l'ordre de grandeur de plusieurs années de textes de journal de Wall Street).

« bon » signifie: si le modèle linguistique sera en mesure de généraliser à partir des données de formation aux données d'entrée nouvelles et inédites

Vous devriez regarder la documentation du Sphinx et les boîtes à outils de modèles de langue HTK.

http://cmusphinx.sourceforge.net/wiki/tutoriallm

Vérifiez également ces deux fils:

bâtiment openears modèle de langage compatible

Ruby Texte Analyse

Vous pouvez prendre un modèle plus général de langue, sur la base d'un plus grand corpus et interpoler votre petit modèle Langue avec elle .. un back-par exemple de modèle de langage ... mais ce n'est pas une tâche triviale.

voir: modèle de back-off de Katz

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top