我对此很好奇。

从广义上讲,一个人如何去做以下事情:

  • 检测单词分离。
  • 音节检测。
  • 补偿正常的语音单词连接。
有帮助吗?

解决方案

直到今天,这仍然是广泛研究的主题。人们通常会开始基于对要进行识别的语言进行语言分析来构建模型,并检测单词分离和音节的所有情况。然后识别主要是使用信号上的隐马尔可夫模型来完成。

以下是一些参考资料,可能会给您一些更好的想法:

http://lands.let.kun.nl/literature/eric.2004.2.pdf

http://www.asel.udel.edu/icslp/cdrom/vol4/778/a778.pdf

http://en.wikipedia.org/wiki/Speech_segmentation

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top