Question

J'ai Sphinx-4 installé sur mon windows XP et JSAPI mis en place. Je voudrais transcrire un fichier WAV anglais parlé (ou MP3) au texte.

Quand je lance le » WavFile » demo - il fonctionne avec succès.

java -jar WavFile.jar

Mais, quand je passe mon propre fichier wav comme ceci:

java -jar WavFile.jar c:\test.wav

Je reçois:

  

Recognizer Chargement tel que défini dans 'jar: file: / C: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/config.xml' ...

     

jar Décodage: file: / C: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/12345.wav   Résultat: un deux trois quatre cinq

Il semble que cette démo est configuré pour charger et exécuter un fichier wav interne (le « 12345.wav ») ou quelque chose.

J'ai lu les documents et ne peux pas comprendre comment configurer le « config.xml » ou même ce répertoire pour le placer. Je suis juste essayer d'obtenir une preuve simple concept en cours d'exécution en utilisant les démos standards .

Alors, la question est: comment puis-je lancer un programme de Sphinx4 pour transcrire un fichier wav?

Merci.

Était-ce utile?

La solution

Je ne sais pas si vous avez encore la réponse. Mais je pense que ce lien est ce que vous voulez (mais fonctionne uniquement pour les données numériques): http://cmusphinx.sourceforge.net /sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html

Autres conseils

Ce qui est nécessaire est d'écrire une nouvelle application (basée sur Transcriber.java) qui utilise le CMU Dictionnaire (anglais américain) au lieu des chiffres qui prend en charge Transcriber.jar.

Il est tout à fait étrange que Sphinx ne vient pas avec un tel échantillon utile.

Je sais que c'est un fil super vieux, mais je voulais juste souligner que votre exemple semble avoir couru parfaitement. Si vous regardez à la fin de votre sortie:

jar Décodage: file: / C: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/12345.wav Résultat: un deux trois quatre cinq <========== RÉSULTATS DE DÉCODAGE AUDIO WAV!

Regardez le paquet pocketsphinx. Il est écrit en C, a été compilé pour chaque plate-forme, et peut être utilisé comme une ligne de commande ou dans le cadre d'une application. Je travaille avec la ligne de commande et il est extrêmement polyvalent.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top