Pergunta

Temos um aplicativo para o qual estávamos planejando usar a API de fala da Microsoft. Agora, testamos no Windows XP usando o Microsoft Sam Voice e, francamente, parece terrível ... é quase impossível ouvir o que a voz está tentando dizer.

Há outra voz melhor. Existem atualizações ou versões mais recentes por aí que são melhores. Existem outro produto, projetos de código aberto etc. que podem funcionar como alternativa?

Apenas para esclarecer - ele precisa ter algum tipo de API para que eu possa programar contra ela.

Foi útil?

Solução

No Windows, o melhor que encontrei foi usar a API de fala e as vozes da AT&T Natural Voices: http://www2.research.att.com/~ttsweb/tts/demo.php

No entanto, eles são muito caros, se disponíveis. Eu encontrei projetos em que o modelo de uso/negócios estava tão longe do que a AT&T estava pensando que eles nem venderiam uma licença.

Há uma alternativa de software livre, festival: http://www.cstr.ed.ac.uk/projects/festival/ , a qualidade, porém, é horrível. Fica cerca de 10 anos atrás da qualidade do som atual dos sistemas comerciais. No entanto, é grátis.

Uma terceira alternativa que funcionou bem para mim foi mudar a parte de síntese de voz de alguns projetos para o OS X. OS X possui um conjunto decente de ferramentas e APIs de fala e um conjunto de vozes bastante decentes. A desvantagem, é claro, é que os prorams escritos para essas APIs são executados apenas no OS X, que é executado apenas no hardware da Apple.

Outras dicas

AT&T Vozes naturais o motor produz um grande discurso, mas não é gratuito
Há também Neospeech que também são bons - não gratuitos também

Você não descreve suas necessidades de licenciamento, então não sei se alguma delas será adequada a esse respeito, mas todas as seguintes são fontes de vozes compatíveis com SAPI 5:

Ivona (http://www.ivona.com/) - Estou usando a voz Kendra em um projeto SAPI.

Vozes naturais da AT&T (http://www2.research.att.com/~ttsweb/tts/)

Loquendo (http://www.loquendo.com/)

Acapela (http://www.acapela-group.com/products/products.asp)

Cepstral (http://www.cepstral.com/)

Fonix (http://www.fonixspeech.com/tts.php) - Somente se você amou o original Fale e feitiço.

Nuancespeak real (não tenho certeza sobre este ...)

Você pode usar o festival gratuito e de código aberto. A voz padrão do festival parece um pouco com Stephen Hawking, mas você pode usar outras vozes do HTS muito melhores. Por exemplo, tente selecionar a voz de Peter HTS 2011 nesta página de demonstração: http://www.cstr.ed.ac.uk/projects/festival/morevoices.html. A maioria das vozes do HTS para o festival que eu já vi não é permitida para uso comercial, no entanto, este parece ser gratuito: http://homepages.inf.ed.ac.uk/jyamagis/software/page54/page54.htmlVocê pode verificar este tutorial do YouTube: http://www.youtube.com/watch?v=mmclfjqpv2o

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top