Pregunta

Tengo Sphinx-4 Instalado en mi sistema Windows XP y JSAPI configurado. Me gustaría transcribir un archivo WAV (o MP3) en inglés al texto.

Cuando corro el Demo de "Wavfile" - Se ejecuta con éxito.

java -jar WavFile.jar

Pero, cuando paso mi propio archivo WAV como este:

java -jar WavFile.jar c:\test.wav

Yo obtengo:

Carga de reconocimiento como se define en 'jar: file:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/config.xml' ... ... ...

Jar de decodificación: archivo:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav Resultado: uno dos cinco cinco

Parece que esta demostración está configurada para cargar y ejecutar un archivo WAV interno ("12345.wav") o algo así.

He leído los documentos y simplemente no puedo imaginar cómo configurar "config.xml" o incluso en qué directorio colocarlo. Solo estoy tratando de obtener una prueba simple de concepto que se ejecute usando las demostraciones estándar.

Entonces, la pregunta es: ¿Cómo ejecuto un programa Sphinx4 para transcribir un archivo WAV?

Gracias.

¿Fue útil?

Solución

No estoy seguro si aún necesita la respuesta. Pero creo que este enlace es lo que desea (pero solo funciona para datos digitales):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/readme.html

Otros consejos

Lo que se necesita es escribir una nueva aplicación (basada en transcriber.java) que usa el Diccionario CMU (inglés americano) en lugar de los números que el transcriper.jar admite.

Es bastante extraño que Sphinx no venga con una muestra tan útil.

Sé que este es un hilo súper antiguo, pero solo quería señalar que tu ejemplo parece haber funcionado perfectamente. Si observa el final de su salida:

Jar de decodificación: archivo:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav Resultado: uno dos cuatro cinco <= = ========= ¡Resultados de la decodificación de audio WAV!

Mire el paquete PocketSphinx. Está escrito en C, se ha compilado para cada plataforma y puede usarse como línea de comandos o como parte de una aplicación. He estado trabajando en línea de comando y es extraordinariamente versátil.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top