Domanda

Ho Sphinx-4 installato sul mio Windows XP e sistema JSAPI istituito. Mi piacerebbe di trascrivere un file WAV inglese parlato (o MP3) al testo.

Quando eseguo il " WavFile" demo - è eseguito correttamente.

java -jar WavFile.jar

Ma, quando mi passa il mio file wav in questo modo:

java -jar WavFile.jar c:\test.wav

ottengo:

  

Caricamento Recognizer come definito 'jar: file: / C:! /Sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/config.xml' ...

     

Decodifica jar: file: / C:! /Sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/12345.wav   Risultato: uno due tre quattro cinque

Sembra che questo demo è configurato per caricare ed eseguire un file interno wav ( "12345.wav") o qualcosa del genere.

Ho letto la documentazione e proprio non riesco a capire come impostare il "config.xml" o anche quello directory per metterlo in. Sto solo cercando di ottenere un semplice proof of concept corrente con le demo standard di .

Quindi, la domanda è: come faccio a eseguire un programma Sphinx4 per trascrivere un file wav?

Grazie.

È stato utile?

Soluzione

Non sono sicuro se hai ancora bisogno di una risposta. Ma penso che questo legame è ciò che si vuole (ma funziona solo per i dati digitali): http://cmusphinx.sourceforge.net /sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html

Altri suggerimenti

Ciò che serve è quello di scrivere una nuova applicazione (in base a Transcriber.java) che utilizza il dizionario CMU (inglese americano) invece dei numeri che Transcriber.jar supporti.

E 'abbastanza strano che Sfinge non viene fornito con un campione così utile.

So che questo è un filo super vecchio, ma volevo solo far notare che il vostro esempio sembra aver funzionato perfettamente. Se si guarda alla fine della vostra uscita:

Decodifica jar: file: / C:! /Sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar Risultato /edu/cmu/sphinx/demo/wavfile/12345.wav: uno due tre quattro cinque <========== RISULTATI dalla decodifica WAV audio!

Guarda il pacchetto pocketsphinx. E 'scritto in C, è stata compilata per ogni piattaforma, e può essere usato come una linea di comando o come parte di un app. Ho lavorato a riga di comando con esso ed è straordinariamente versatile.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top