从语音识别和语音综合开始

https://stackoverflow.com/questions/3881015

28-09-2019
|

题

我想开始语音识别和语音综合基于语音识别的原型有人告诉我使用Microsoft Speech Server（SDK等）

当我有这个时，如何编程应用程序以及使用哪种编程语言（开发环境？）？

有人有Asterisk或Svox的经验吗？

我需要去做：

语音识别语音综合

我不必是一个很好的语音识别 - 我认为30 -50个单词应该足够开始。我正在使用Windows。

提前致谢

解决方案

如果您选择使用Microsoft语音引擎，则有.NET Framework API。正如我在另一篇文章中提到的那样，有两个名称空间（System.Speech用于桌面使用，Microsoft.speech用于服务器使用）。您可以使用任何.NET语言编程，并且可以使用Visual Studio。

几年前，有一篇非常好的文章在 http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. 。这可能是我到目前为止发现的最好的介绍性文章。但是，它基于WinFX API的预发行版，并基于System.System.Sspeech类。当Vista释放时，Spech类已更改。由于这些破坏API的变化，本文中的样本没有编译，我还没有找到任何更新或Errata来解释这一点。搜索Internet以获取方法名称“ AppendResultKeyValue”，您会发现一些论坛帖子，例如 http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html 人们遇到了同样的问题。

这仍然是一篇很好的介绍性文章，值得一读。有了一点点黑客，您就可以使示例应用程序正常工作。

其他提示

当我研究计算语言学时，选择的工具是 Praat, 这是一种令人困惑的原型制作工具，可让您完成与语音有关的任何事情。

我认为它没有任何外部API，但是它的内部脚本语言足以用于基本应用，并且具有许多内置功能。对于理论上的“入门”和算法，这还不错。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow