Frage

ich habe Sphinx-4 auf meinem Windows XP-System installiert und JSAPI eingerichtet.Ich möchte eine auf Englisch gesprochene WAV- (oder MP3-)Datei in Text umwandeln.

Wenn ich das ausführe „WavFile“-Demo - es läuft erfolgreich.

java -jar WavFile.jar

Aber wenn ich meine eigene WAV-Datei so übergebe:

java -jar WavFile.jar c:\test.wav

Ich bekomme:

Laden des Recognizers wie in „jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml“ definiert...

Decoding Jar: Datei:/C: /Spinx4-1.0beta3-bin/Sphinx4-1.0beta3/Bin/wavfile.jar! /Edu/cmu/Sphinx/demo/wavfile/12345.wav Ergebnis:eins zwei drei vier fünf

Es scheint, dass diese Demo zum Laden und Ausführen einer internen WAV-Datei („12345.wav“) oder so etwas eingerichtet ist.

Ich habe die Dokumente gelesen und weiß einfach nicht, wie ich die „config.xml“ einrichten soll oder in welchem ​​Verzeichnis ich sie ablegen soll.Ich versuche lediglich, mithilfe der Standarddemos einen einfachen Proof of Concept zum Laufen zu bringen.

Die Frage ist also:Wie führe ich ein Sphinx4-Programm aus, um eine WAV-Datei zu transkribieren?

Danke.

War es hilfreich?

Lösung

Ich bin mir nicht sicher, ob Sie die Antwort noch brauchen.Aber ich denke, dieser Link ist das, was Sie wollen (funktioniert aber nur für digitale Daten):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html

Andere Tipps

Was benötigt wird, ist das Schreiben einer neuen Anwendung (basierend auf Transcriber.java), die das CMU-Wörterbuch (Amerikanisches Englisch) anstelle der von Transcriber.jar unterstützten Zahlen verwendet.

Es ist ziemlich seltsam, dass Sphinx kein so nützliches Beispiel mitbringt.

Ich weiß, dass dies ein sehr alter Thread ist, aber ich wollte nur darauf hinweisen, dass Ihr Beispiel anscheinend perfekt gelaufen ist.Wenn Sie sich das Ende Ihrer Ausgabe ansehen:

Dekodierung jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav Ergebnis:eins zwei drei vier fünf <========== ERGEBNISSE DER DECODIERUNG VON WAV-AUDIO!

Schauen Sie sich das Pocketphinx-Paket an.Es ist in C geschrieben, für jede Plattform kompiliert und kann als Befehlszeile oder als Teil einer App verwendet werden.Ich habe damit über die Befehlszeile gearbeitet und es ist außerordentlich vielseitig.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top