Sphinx4で動作するようにWAVファイル転写を取得します
-
19-09-2019 - |
質問
私が持っている Sphinx-4 Windows XPシステムとJSAPIセットアップにインストールされています。英語の音声WAV(またはMP3)ファイルをテキストに転写したいと思います。
私が実行するとき 「Wavfile」デモ - 正常に実行されます。
java -jar WavFile.jar
しかし、私がこのように自分のWAVファイルを渡すとき:
java -jar WavFile.jar c:\test.wav
わかりました:
'jar:file:/c:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml' ...
jarのデコード:file:/c:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar!
このデモは、内部WAVファイル( "12345.wav")または何かをロードして実行するように設定されているようです。
ドキュメントを読んだことがありますが、「config.xml」をセットアップする方法や、どのディレクトリを配置するかを理解することはできません。
質問は、WAVファイルを転写するためにSphinx4プログラムを実行するにはどうすればよいですか?
ありがとう。
解決
まだ答えが必要かどうかはわかりません。しかし、このリンクはあなたが望むものだと思います(ただし、デジタルデータでのみ機能します):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/readme.html
他のヒント
必要なのは、transcriber.jarがサポートする数字の代わりにCMU辞書(American English)を使用する新しいアプリケーション(transcriber.javaに基づく)を作成することです。
Sphinxにこのような有用なサンプルが付属していないことは非常に奇妙です。
これは非常に古いスレッドであることは知っていますが、あなたの例が完全に実行されたように見えることを指摘したかっただけです。出力の最後を見ると:
ジャーのデコード:file:/c:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! ========= WAVオーディオのデコードの結果!
Pocketsphinxパッケージを見てください。 Cで書かれており、すべてのプラットフォーム用にコンパイルされており、コマンドラインまたはアプリの一部として使用できます。私はそれでコマンドラインを働いてきましたが、それは非常に多用途です。