Начало работы с распознаванием речи и синтез речи
-
28-09-2019 - |
Вопрос
Я хочу начать работу с распознаванием речи и синтез речи в Прототип на основе признания речиКто-то сказал мне использовать Microsoft речевой сервер (SDK и так далее)
Когда у меня есть это, как мне программировать приложение, и с каким языком программирования (развитие Envireoment?)?
Есть ли кто-то опыт со звездочкой или SVOX?
мне нужно сделать:
Распознавание речи Синтез речи
Мне не нужно быть очень хорошим признанием речи - я думаю, что 30 -50 слов должны быть достаточно для начала. Я работаю с Windows.
заранее спасибо
Решение
Если вы решите использовать Microsoft речевой двигатель, есть .NET Framework API. Как я уже упоминал в другом посте, существует два пространства имен (System.speech для настольного использования и Microsoft.speech для использования сервера). Вы можете запрограммировать на любом языке .NET, и вы можете использовать Visual Studio.
Есть очень хорошая статья, которая была опубликована несколько лет назад в http://msdn.microsoft.com/en-us/magazine/cc163663.aspx.. Отказ Вероятно, это лучшее вступительная статья, которую я нашел до сих пор. Тем не менее, он основан на предварительной версии API WinFX и System.spech Classes были изменены, когда выпущен Vista. Образцы в статье не компилируются из-за этих изменений API, и я не нашел никаких обновлений или ошибок, чтобы объяснить это. Ищите в интернете для имени метода «AppendResultkeyValue», вы найдете несколько сообщений на форуме, как http://www.ms-news.net/f3012/system-speek-breaking-changes-3025734.html. где люди бежали в эту же проблему.
Это все еще хорошая вводная статья и стоит читать. С небольшим количеством взлома вы можете получить образец приложения.
Другие советы
Когда я изучал вычислительную лингвистику, инструмент выбора был Преступность, ужасно запутанный инструмент прототипирования, который позволяет вам делать только что-то речевое.
Я не думаю, что у него есть внешний API, но его внутренний язык сценариев достаточно для рудиментарных приложений, и у него много встроенных функций. Для «Начало работы» по теории и алгоритмам это не так уж плохо.