Question

Nous avons une application que nous raboter à utiliser l'API Microsoft de la parole pour. Maintenant, nous l'avons testé sur Windows XP en utilisant la voix Microsoft Sam et franchement sonner terribles ... Il est presque impossible d'entendre ce que la voix essaie de dire.

Y at-il d'autres, une meilleure voix. Y a-t-il des mises à jour ou des versions plus récentes qui sont là mieux. Y at-il d'autres produits, les projets open source etc qui peut fonctionner comme une alternative?

Juste pour préciser - Il doit avoir une sorte de API afin que je puisse réellement programmer contre

.
Était-ce utile?

La solution

Sous Windows sur le meilleur que je l'ai trouvé utilisait l'API vocale et des voix d'AT & T Natural Voices: http://www2.research.att.com/~ttsweb/tts/demo.php

Ils sont cependant très cher si elle est disponible à tous. J'ai couru dans des projets où le modèle d'utilisation / entreprise était si loin de ce que AT & T pensait qu'ils seraient même pas vendre une licence.

Il existe une alternative du logiciel libre, Festival: http: //www.cstr .ed.ac.uk / projets / festival / , la qualité mais est horrible. Il est environ 10 ans derrière la qualité sonore actuelle des systèmes commerciaux. Cependant, il est libre.

Une troisième alternative qui a bien fonctionné pour moi était de déplacer la partie de la synthèse vocale de quelques projets à OS X. OS X dispose d'un ensemble décent d'outils et APIs de la parole et un ensemble assez décent de voix d'actions. L'inconvénient est bien sûr que prorams écrites pour ces API ne fonctionnent que sous OS X qui ne fonctionne que sur le matériel Apple.

Autres conseils

Vous ne décrivez pas vos besoins de licence, donc je ne sais pas si d'entre eux seront appropriés à cet égard, mais toutes les conditions suivantes sont des sources de SAPI 5 voix compatibles:

Ivona ( http://www.ivona.com/ ) - J'utilise leur voix Kendra sur un projet SAPI.

AT & T Natural Voices ( http://www2.research.att.com/~ttsweb / tts / )

Loquendo ( http://www.loquendo.com/ )

Acapela ( http://www.acapela-group.com/products/products. asp )

Cepstral ( http://www.cepstral.com/ )

Fonix ( http://www.fonixspeech.com/tts.php ) - seulement si vous avez aimé le Speak & sort.

Nuance RealSpeak (Je ne suis pas sûr de celui-ci ...)

Vous pouvez utiliser festival gratuit et open source. Par défaut, la voix du Festival sonne un peu comme Stephen Hawking, mais vous pouvez utiliser d'autres bien meilleures voix HTS. Par exemple, sélectionnez Peter HTS 2011 voix sur cette page de démonstration: http: // www.cstr.ed.ac.uk/projects/festival/morevoices.html . La plupart des voix pour HTS festival que je l'ai vu ne sont pas autorisés pour un usage commercial mais celui-ci semble être libre: http://homepages.inf.ed.ac.uk/jyamagis/software/page54/page54.html Vous pouvez consulter ce tutoriel youtube: http://www.youtube.com/watch?v=MmcLFJQpv2o

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top