Vozes de mecanismo de texto para falar de texto do Google?
Pergunta
A maioria de vocês provavelmente conhece o sintetizador de texto em fala do Google Translate, pois você pode acessar programaticamente aqui:
http://translate.google.com/translate_tts?tl=en&q=text
Minha impressão era que às vezes está usando Espeak, mas nos principais idiomas, a qualidade é muito melhor do que isso. Alguém sabe o que o Google está usando ou quais vozes eles estão usando? Claramente, não é as vozes normais e também não as mbrola espék.
Solução
Eu procuraria na lista de aquisições do Google
(Wikipedia, lista de aquisições do Google):
84 de dezembro de 2010 Artes Fonéticas Síntese de fala uk Google Voice, Google tradutor [90
Outras dicas
Eu fiz um envoltório simples com Ruby. https://github.com/c2h2/tts
gem install tts
require 'tts'
'hello world!".to_file "en"
Eu ficaria surpreso se o Google Translate estiver usando Espeak. Em primeiro lugar, os resultados são bons demais e carecem de muitas falhas de Espeam típicas. Segundo, o Google é conhecido por usar idéias como redes profundas em seu grupo de fala (veja o trabalho de Geof Hinton e também http://research.google.com/pubs/speechprocessing.html).
Tentar pyttsx
: https://github.com/parente/pyttsx
$ pip install pyttsx
$ python
>>> import pyttsx
>>> e = pyttsx.init()
>>> e.say('haha hahaha haha haha hahaha')
>>> e.runAndWait()
Use o pyttsx3 Módulo para Python3.
Apenas use pip install pyttsx3
para instalar