質問

私が持っている Sphinx-4 Windows XPシステムとJSAPIセットアップにインストールされています。英語の音声WAV(またはMP3)ファイルをテキストに転写したいと思います。

私が実行するとき 「Wavfile」デモ - 正常に実行されます。

java -jar WavFile.jar

しかし、私がこのように自分のWAVファイルを渡すとき:

java -jar WavFile.jar c:\test.wav

わかりました:

'jar:file:/c:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml' ...

jarのデコード:file:/c:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar!

このデモは、内部WAVファイル( "12345.wav")または何かをロードして実行するように設定されているようです。

ドキュメントを読んだことがありますが、「config.xml」をセットアップする方法や、どのディレクトリを配置するかを理解することはできません。

質問は、WAVファイルを転写するためにSphinx4プログラムを実行するにはどうすればよいですか?

ありがとう。

役に立ちましたか?

解決

まだ答えが必要かどうかはわかりません。しかし、このリンクはあなたが望むものだと思います(ただし、デジタルデータでのみ機能します):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/readme.html

他のヒント

必要なのは、transcriber.jarがサポートする数字の代わりにCMU辞書(American English)を使用する新しいアプリケーション(transcriber.javaに基づく)を作成することです。

Sphinxにこのような有用なサンプルが付属していないことは非常に奇妙です。

これは非常に古いスレッドであることは知っていますが、あなたの例が完全に実行されたように見えることを指摘したかっただけです。出力の最後を見ると:

ジャーのデコード:file:/c:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! ========= WAVオーディオのデコードの結果!

Pocketsphinxパッケージを見てください。 Cで書かれており、すべてのプラットフォーム用にコンパイルされており、コマンドラインまたはアプリの一部として使用できます。私はそれでコマンドラインを働いてきましたが、それは非常に多用途です。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top