我有狮身人面像-4 在我的Windows XP安装系统和JSAPI成立。我想录制的英语口语WAV(或MP3)文件中的文本。

当我运行” WavFile”演示 - 它成功运行。

java -jar WavFile.jar

但是,当我通过我自己的wav文件是这样的:

java -jar WavFile.jar c:\test.wav

我得到:

  

装载识别器中所定义的 '罐子:文件:/ C:!/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/config.xml' ...

     

解码罐子:文件:/ C:!/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/12345.wav   结果:一个二三四五

看来此演示是设置加载并运行一个内部wav文件(“12345.wav”)或东西。

我已经阅读文档,只是想不出如何设置“config.xml中”,甚至什么目录来放置它,我只是试图让概念的一个简单证明使用标准的演示运行。

所以,问题是:我怎么运行Sphinx4节目录制WAV文件?

感谢。

有帮助吗?

解决方案

不知道如果你仍然需要的答案。但我认为这个链接是你想要的(但只适用于数字数据): http://cmusphinx.sourceforge.net /sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html

其他提示

现在需要的是写的,而不是数字,使用CMU词典(美国英语)的新应用(基于Transcriber.java),其Transcriber.jar支持。

这是很奇怪的是,斯芬克斯没有附带这样一个有用的样本。

我知道这是一个超级旧线,但我只是想指出的是您的例子似乎已经完美运行。如果你看看你输出的最后:

解码罐子:文件:/ C:!/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/12345.wav结果:一二三四5 <==========结果从解码WAV音频!

看那pocketsphinx包。这是写在C,已被编为每一个平台,并且可以作为一个命令行或作为应用程序的一部分。我已经工作命令行与它和它是非常通用的。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top