Text-to-speech (génération de voix) et de la parole en texte (reconnaissance vocale) API?

https://stackoverflow.com/questions/6348770

27-10-2019
|

Question

Y at-il une liste complète des API connues pour les environnements de bureau ou d'un navigateur?

La solution

Je vais ressasser et mettre à jour une réponse de reconnaissance vocale en C ou Java ou PHP? . Ceci est loin d'être exhaustive, mais il pourrait être un début pour vous

De regarder ces questions pour quelques mois, je l'ai vu la plupart des choix de développement se décomposent comme suit:

Les fenêtres des gens - utilisation des fonctionnalités de la System.Speech de .Net ou Microsoft.Speech et installer les Microsoft fournit gratuitement reconnaisseurs. Windows 7 comprend un moteur vocal complet. D'autres sont téléchargeables gratuitement. Il y a une API C ++ pour les mêmes moteurs connus sous le nom SAPI. Voir http://msdn.microsoft.com/en-us/magazine/ cc163663.aspx . ou http://msdn.microsoft.com/ fr-fr / bibliothèque / ms723627 (v = vs.85) .aspx . Plus d'arrière-plan sur les moteurs Microsoft pour Windows Quelle est la différence entre System.Speech .Recognition et Microsoft.Speech.Recognition

Linux gens - Sphinx semble avoir un bon suivi. Voir http://cmusphinx.sourceforge.net/ et http://cmusphinx.sourceforge.net/wiki/

Les produits commerciaux - Nuance , Loquendo , AT & T , IBM , d'autres. Fournissent chacun leurs propres bibliothèques et SDKs pour diverses langues.

Service en ligne - Nuance , Yapme , ispeech.org , Vlingo , d'autres. Nuance a amélioré son programme de développement et vous donnera maintenant libre accès à leurs services pour le développement . Yap (je crois) a été récemment http://en.wikipedia.org/wiki/List_of_speech_recognition_software

Il y a une API vocale Java. Voir javax.speech.recognition dans l'API Java Speech http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html . Je crois que vous avez encore à trouver un moteur de reconnaissance vocale qui prend en charge cette API. Je ne pense pas que Sphinx soutient pleinement - http: // cmusphinx. sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

Il y a beaucoup d'autres SO quesitons: texte Besoin d'outils de reconnaissance vocale et de la parole pour Linux et pyspeech (python) - Transcribe fichiers mp3 qui parle de http://code.google.com/p/pyspeech/ . Vous pouvez également regarder http://code.google.com/p/dragonfly/

Autres conseils

Les principaux fournisseurs de l'API de texte à la parole (génération vocale) sont YAKiToMe! et iSpeech. YAKiToMe! est celui que j'utilise parce que je leur qualité comme la voix la meilleure et ils sont les moins chers (la plupart du temps libre). Ils soutiennent haut-parleurs masculins et féminins dans plusieurs langues. Certains des fournisseurs de voix, comme Acapella, Nuance, Loquendo et Ivona ont des voix décentes, mais ont tendance à être coûteux à utiliser.

Voici comment vous pouvez le faire: Note: il est un api de google, donc il ne fonctionne que dans le navigateur Chrome.

(Voir la démo en direct et télécharger le code source complet ici http://purpledesign.in/blog/? p = 33 )

définir un bouton

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

et définir ce que vous voulez faire dans une fonction javascript dans votre fichier

Comme cette

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

ici

<textarea> id="test"></textarea>

Le discours est écrit dans la zone de texte

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow