如何将 MP3 格式的语音转换为文本?

我有一些来自会议和会议的录音笔记(录音中有一个声音,那就是我的声音)。我认为使用语音转文本工具将其转换为文本比简单地手动转录会更容易且更有趣。我知道有一些技术,特别是对于使用 Asterisk 和 Podcast 的 VoIP 应用程序,但它们是什么以及如何使用它们?

有帮助吗?

解决方案

开源: CMU斯芬克斯

共享软件: http://www.e-speaking.com/ (视窗)

商业:龙NaturallySpeaking (视窗)

其他提示

.NET可与其System.Speech命名空间做到这一点。

您将不得不转换为.wav第一或捕捉声音从话筒生活。

在实施细节可以在这里找到: 转录音频与.NET

龙NaturallySpeaking 似乎支持MP3输入。

如果你想href="http://www.speech.cs.cmu.edu/" rel="nofollow noreferrer">开源版本的

聚会迟到了,所以回答更多以供将来参考。

该领域的进步 + Mozilla 的思维方式和议程导致了这两个项目的实现:

后者有 12GB 的数据集可供下载。据我了解,前者允许使用您自己的音频文件来训练模型

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top