Question

Je suis en train de recherche disponibles moteurs de reconnaissance vocale et SDK pour le développement d'une voix Windows CE application activée. J'ai couru à travers Nuance, mais ne vois pas beaucoup d'autre chose. Je préférerais un SDK .Net si possible, mais j'imagine que la plupart serait C / C ++. Je vous remercie des suggestions. Merci.

Était-ce utile?

La solution 5

Comme indiqué dans un de mes commentaires ci-dessus, nous essayons une reconnaissance vocale .Net SDK de Vangard voix Systems. Il utilise le moteur de reconnaissance vocale de Nuance Vocon3200 qui est bien respecté et semble bien fonctionner dans le dépistage précoce. Nous utilisons un microphone pas cher en ce moment et ont des problèmes avec le bruit extérieur. Il faut espérer que seront résolus avec des casques antibruit. Le modèle de logiciel est un peu défaut en ce qu'elle accroche essentiellement dans une application non vocale existante. Il y a quelques limites en raison de ce fait et il y a une API limitée accessible par le développeur. Chaque fois que vous essayez de schématiser quelque chose comme ça, vous faites l'élaboration d'une solution puissante beaucoup plus difficile. Cela étant dit, nous ne pouvions pas trouver un produit concurrent qui sert nos besoins d'un SDK .Net pour l'activation vocale des applications mobiles. Ils ont actuellement une petite niche bien taillé.

J'aurais préféré aller avec Nuance de C ++ SDK (pour lequel une autre société a écrit wrappers .Net), mais le modèle d'affaires Nuance nous suppose développons un produit pour la revente et a des redevances importantes impliquées. Une véritable barrière pour une entreprise qui veut développer des applications internes.

Autres conseils

Nuance a essentiellement acheté tout le monde. Ils dominent le marché de la parole, je crains ...

Il y a quelques autres entreprises qui traitent de la technologie, mais je ne sais pas comment ils le font dans le marché de l'embarqué. Il est telisma et Loquendo , les deux qui ont de fortes présences non anglophones (et leur anglais est pas trop mal non plus).

Ensuite, il y a encore IBM. Ils ont ViaVoice embarqué.

L'une des grandes choses que l'industrie attend pour est de voir ce qui sort de l'acquisition par Microsoft de TellMe , mais je pense que le marché de l'embarqué ils pourraient rester à l'écart du lieu de pousser le traitement du « nuage », qui est l'endroit où TellMe a été depuis longtemps.

Je travaille avec des applications de réponse vocale interactive; en plus de Nuance nous évaluons actuellement Microsoft, IBM et Lumenvox.

Les applications de reconnaissance vocale inclus dans la plupart des téléphones cellulaires sont conçus pour correspondre à l'entrée vocale à une phrase parlé précédemment, comme l'attribution de la phrase « Joe » à une entrée du carnet d'adresses et d'avoir votre téléphone à composer que l'entrée du carnet d'adresses lorsque vous dites " Joe ». Les moteurs de reconnaissance vocale les plus puissants tentent de déchiffrer la parole freeform en brisant une phrase vers le bas dans phonèmes, et puis correspondant contre un dépôt acoustique pour essayer de comprendre ce qui a été dit. Un moteur de reconnaissance vocale pleine soufflé nécessite une bonne quantité de puissance du processeur; de faire quoi que ce soit complexe avec la reconnaissance vocale sur un appareil mobile, vous aurez probablement besoin d'envoyer des données à partir du périphérique à un serveur pour le traitement.

Essayez de regarder dans l'API Speech de Microsoft, http://msdn.microsoft. com / fr-fr / bibliothèque / ms897381.aspx

Je crois qu'il fonctionne sur les périphériques.

Il y a aussi le projet open source CMU Sphinx . Ils ont une variante appelée pocketsphinx qui a été ciblé pour les appareils portables.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top