我想开始语音识别和语音综合 基于语音识别的原型有人告诉我使用Microsoft Speech Server(SDK等)

当我有这个时,如何编程应用程序以及使用哪种编程语言(开发环境?)?

有人有Asterisk或Svox的经验吗?

我需要去做:

语音识别语音综合

我不必是一个很好的语音识别 - 我认为30 -50个单词应该足够开始。我正在使用Windows。

提前致谢

有帮助吗?

解决方案

如果您选择使用Microsoft语音引擎,则有.NET Framework API。正如我在另一篇文章中提到的那样,有两个名称空间(System.Speech用于桌面使用,Microsoft.speech用于服务器使用)。您可以使用任何.NET语言编程,并且可以使用Visual Studio。

几年前,有一篇非常好的文章在 http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. 。这可能是我到目前为止发现的最好的介绍性文章。但是,它基于WinFX API的预发行版,并基于System.System.Sspeech类。当Vista释放时,Spech类已更改。由于这些破坏API的变化,本文中的样本没有编译,我还没有找到任何更新或Errata来解释这一点。搜索Internet以获取方法名称“ AppendResultKeyValue”,您会发现一些论坛帖子,例如 http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html 人们遇到了同样的问题。

这仍然是一篇很好的介绍性文章,值得一读。有了一点点黑客,您就可以使示例应用程序正常工作。

其他提示

当我研究计算语言学时,选择的工具是 Praat, 这是一种令人困惑的原型制作工具,可让您完成与语音有关的任何事情。

我认为它没有任何外部API,但是它的内部脚本语言足以用于基本应用,并且具有许多内置功能。对于理论上的“入门”和算法,这还不错。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top