Obtener la transcripción de archivo WAV para funcionar con Sphinx4
-
19-09-2019 - |
Pregunta
Tengo Sphinx-4 Instalado en mi sistema Windows XP y JSAPI configurado. Me gustaría transcribir un archivo WAV (o MP3) en inglés al texto.
Cuando corro el Demo de "Wavfile" - Se ejecuta con éxito.
java -jar WavFile.jar
Pero, cuando paso mi propio archivo WAV como este:
java -jar WavFile.jar c:\test.wav
Yo obtengo:
Carga de reconocimiento como se define en 'jar: file:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/config.xml' ... ... ...
Jar de decodificación: archivo:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav Resultado: uno dos cinco cinco
Parece que esta demostración está configurada para cargar y ejecutar un archivo WAV interno ("12345.wav") o algo así.
He leído los documentos y simplemente no puedo imaginar cómo configurar "config.xml" o incluso en qué directorio colocarlo. Solo estoy tratando de obtener una prueba simple de concepto que se ejecute usando las demostraciones estándar.
Entonces, la pregunta es: ¿Cómo ejecuto un programa Sphinx4 para transcribir un archivo WAV?
Gracias.
Solución
No estoy seguro si aún necesita la respuesta. Pero creo que este enlace es lo que desea (pero solo funciona para datos digitales):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/readme.html
Otros consejos
Lo que se necesita es escribir una nueva aplicación (basada en transcriber.java) que usa el Diccionario CMU (inglés americano) en lugar de los números que el transcriper.jar admite.
Es bastante extraño que Sphinx no venga con una muestra tan útil.
Sé que este es un hilo súper antiguo, pero solo quería señalar que tu ejemplo parece haber funcionado perfectamente. Si observa el final de su salida:
Jar de decodificación: archivo:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav Resultado: uno dos cuatro cinco <= = ========= ¡Resultados de la decodificación de audio WAV!
Mire el paquete PocketSphinx. Está escrito en C, se ha compilado para cada plataforma y puede usarse como línea de comandos o como parte de una aplicación. He estado trabajando en línea de comando y es extraordinariamente versátil.