Question

Je veux commencer avec la reconnaissance vocale et la synthèse de la parole prototype basé sur la reconnaissance vocale quelqu'un m'a dit d'utiliser le serveur vocal Microsoft (sdk etc.)

quand j'ai cela, comment Programm je ne demande, et avec quel langage de programmation (ambience développement?)?

a quelqu'un d'expérience avec astérisque ou SVOX?

je dois faire:

reconnaissance vocale synthèse vocale

i ne dois pas être une très bonne reconnaissance vocale - je pense que 30 -50 mots devraient être assez pour le début. Je travaille avec des fenêtres.

Merci à l'avance

Était-ce utile?

La solution

Si vous choisissez d'utiliser le Microsoft Speech Engine, il existe des API .NET Framework. Comme je l'ai mentionné dans l'autre poste, il y a deux espaces de noms (System.Speech pour une utilisation de bureau et Microsoft.Speech pour une utilisation du serveur). Vous pouvez programmer dans toutes les langues .NET et vous pouvez utiliser Visual Studio.

Il y a un très bon article qui a été publié il y a quelques années à http: //msdn.microsoft.com/en-us/magazine/cc163663.aspx . Il est probablement le meilleur article d'introduction, je l'ai trouvé à ce jour. Cependant, il a été basé sur une version préliminaire de l'API WinFX et les classes System.Speech ont été changés quand a été libéré Vista. Les échantillons dans l'article ne compilent pas à cause de ces changements de rupture de l'API et je n'ai pas trouvé de mises à jour ou errata pour expliquer cela. Rechercher sur Internet pour le nom de la méthode « AppendResultKeyValue », vous trouverez quelques messages du forum comme http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html où les gens couraient dans ce même problème.

Il est encore un bon article d'introduction et mérite d'être lu. avec un peu de piratage, vous pouvez obtenir le travail de l'application exemple.

Autres conseils

Quand je a étudié la linguistique computationnelle l'outil de choix était Praat, un horriblement confus outil de prototypage qui vous permet de faire à peu près tout ce qui concerne la parole.

Je ne pense pas qu'il a une API externe, mais son langage de script interne est suffisante pour les applications rudimentaires, et il a beaucoup de fonctions intégrées. Pour « commencer » sur la théorie et les algorithmes, il est pas trop mal.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top