Ottenere la trascrizione file WAV per lavorare con Sphinx4
-
19-09-2019 - |
Domanda
Ho Sphinx-4 installato sul mio Windows XP e sistema JSAPI istituito. Mi piacerebbe di trascrivere un file WAV inglese parlato (o MP3) al testo.
Quando eseguo il " WavFile" demo - è eseguito correttamente.
java -jar WavFile.jar
Ma, quando mi passa il mio file wav in questo modo:
java -jar WavFile.jar c:\test.wav
ottengo:
Caricamento Recognizer come definito 'jar: file: / C:! /Sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/config.xml' ...
Decodifica jar: file: / C:! /Sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/12345.wav Risultato: uno due tre quattro cinque
Sembra che questo demo è configurato per caricare ed eseguire un file interno wav ( "12345.wav") o qualcosa del genere.
Ho letto la documentazione e proprio non riesco a capire come impostare il "config.xml" o anche quello directory per metterlo in. Sto solo cercando di ottenere un semplice proof of concept corrente con le demo standard di .
Quindi, la domanda è: come faccio a eseguire un programma Sphinx4 per trascrivere un file wav?
Grazie.
Soluzione
Non sono sicuro se hai ancora bisogno di una risposta. Ma penso che questo legame è ciò che si vuole (ma funziona solo per i dati digitali): http://cmusphinx.sourceforge.net /sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html
Altri suggerimenti
Ciò che serve è quello di scrivere una nuova applicazione (in base a Transcriber.java) che utilizza il dizionario CMU (inglese americano) invece dei numeri che Transcriber.jar supporti.
E 'abbastanza strano che Sfinge non viene fornito con un campione così utile.
So che questo è un filo super vecchio, ma volevo solo far notare che il vostro esempio sembra aver funzionato perfettamente. Se si guarda alla fine della vostra uscita:
Decodifica jar: file: / C:! /Sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar Risultato /edu/cmu/sphinx/demo/wavfile/12345.wav: uno due tre quattro cinque <========== RISULTATI dalla decodifica WAV audio!
Guarda il pacchetto pocketsphinx. E 'scritto in C, è stata compilata per ogni piattaforma, e può essere usato come una linea di comando o come parte di un app. Ho lavorato a riga di comando con esso ed è straordinariamente versatile.