Question

Je prévois d'écrire un programme pour Linux qui utilise le texte à la parole et la reconnaissance vocale. Quels sont les meilleurs outils / bibliothèques pour cela? Dois-je utiliser Windows plutôt que d'être en mesure d'utiliser de meilleurs outils? Les outils doivent être facilement appelable d'un programme de console ou C.

Était-ce utile?

La solution

Pour la reconnaissance vocale, il y a les différents Sphinxes. Les différentes variantes ont des avantages et des inconvénients, il y a ici une comparaison Comparaison des versions Sphinx . Sphinx 4 est Java, mais les autres sont C, je crois.

Autres conseils

Cela dépend un peu de ce discours que vous essayez de reconnaître.

Ceci est un article de 2005 qui explique certaines difficultés dans la création d'un programme de dictée: http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html . Si vous voulez que le rel="nofollow moteur de reconnaissance vocale de Julius semble prometteur, mais vous aurez besoin d'ajouter votre propres modèles acoustiques et linguistiques. Vous pourriez être en mesure d'utiliser le voxforge modèle acoustique.

Si vous ne tentez pas d'écrire un programme de dictée, alors vous avez une tâche beaucoup plus facile. programmes de commande ont vocabulaires limités, par exemple: «Si vous voulez continuer en anglais, dire « anglais ».

Je suis en mesure d'obtenir de très bons résultats en utilisant pocketsphinx et GStreamer pour faire un programme automatiquement édite la plupart des occurrences du mot " twitter " sur podcast de TWiT. Il ne fonctionne pas du tout jusqu'à ce que j'utilisé mon propre modèle de langage basé sur les transcriptions du podcast; les transcriptions de la machine de reconnaissance de la parole sont inutiles / hilarant, mais ils font un travail correct de trouver le mot-clé.

Je l'ai utilisé à la fois Loquendo et festival sous linux. Je considérerais les voix du festival, je l'ai utilisé assez pauvre, avec la synthèse très robotique. Les voix Loquendo, d'autre part, sont excellents - très haute qualité.

Pour Debian / text-to-speech Ubuntu il y a aussi SVOX Pico:

sudo apt-get install libttspico-utils

Je sais que espeak est un très bon programme texte-to-speech pour linux (il peut même faire différents accents!), mais je ne sais pas de tout système de reconnaissance vocale conçu pour UNIX.

AT & T boîte à outils est aussi assez EFM génial - pas d'utilisation commerciale autorisée si,

http://www.research.att.com/~fsmtools/fsm/

Ceci est un peu vieux, mais je l'ai vu un guide assez complet sur la reconnaissance vocale sur Hackaday il y a quelques jours: http://hackaday.com/2010/07/09 / get-a commencé avec reconnaissance vocale /

http://simon-listens.org/ - simon parole open-source / programme de reconnaissance vocale

Et puis il y a mbrola pour le texte à la parole.

Avez-vous vérifié la synthèse de la parole HMM-texte-parole. Vous trouverez la démo gratuite sur le site http://hts.sp.nitech.ac.jp/ . L'installation sera peu fastidieux.

The original question was about finding suitable libraries, I know, but from as far as using speech recognition good enough for real dictation, there seems to be nothing out there for Linux (though I am sure it will change in time, I suspect it will take a while,as I am not sure that many people are interested).

At the moment I am trying to promote Dragon NaturallySpeaking as a supported product by CodeWeavers ... so if you are interested as a user it would help if you would cast a vote ...

http://www.codeweavers.com/compatibility/browse/name/?app_id=8427

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top