Pergunta

A maioria de vocês provavelmente conhece o sintetizador de texto em fala do Google Translate, pois você pode acessar programaticamente aqui:

http://translate.google.com/translate_tts?tl=en&q=text

Minha impressão era que às vezes está usando Espeak, mas nos principais idiomas, a qualidade é muito melhor do que isso. Alguém sabe o que o Google está usando ou quais vozes eles estão usando? Claramente, não é as vozes normais e também não as mbrola espék.

Foi útil?

Solução

Eu procuraria na lista de aquisições do Google
(Wikipedia, lista de aquisições do Google):

84 de dezembro de 2010 Artes Fonéticas Síntese de fala uk Google Voice, Google tradutor [90

Outras dicas

Eu fiz um envoltório simples com Ruby. https://github.com/c2h2/tts

gem install tts
require 'tts'
'hello world!".to_file "en"

Tente este:

Fala utilizada

É livre, mas apenas para o inglês.

Eu ficaria surpreso se o Google Translate estiver usando Espeak. Em primeiro lugar, os resultados são bons demais e carecem de muitas falhas de Espeam típicas. Segundo, o Google é conhecido por usar idéias como redes profundas em seu grupo de fala (veja o trabalho de Geof Hinton e também http://research.google.com/pubs/speechprocessing.html).

Tentar pyttsx: https://github.com/parente/pyttsx

$ pip install pyttsx
$ python
>>> import pyttsx
>>> e = pyttsx.init()
>>> e.say('haha hahaha haha haha hahaha')
>>> e.runAndWait()

Use o pyttsx3 Módulo para Python3.

Apenas use pip install pyttsx3 para instalar

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top