Google text-to voci motore vocale?
Domanda
La maggior parte di voi probabilmente conoscono il sintetizzatore text-to-speech di Google Translate, come è possibile accedere a livello di codice qui btw:
http://translate.google.com/translate_tts?tl=en&q=text
La mia impressione è che è a volte usando eSpeak, ma nelle principali lingue, la qualità è molto migliore di quella. Qualcuno sa quello che Google sta usando, o che voci stanno usando? Chiaramente non è la normale e anche non i MBROLA eSpeak voci.
Soluzione
vorrei cercare nella lista dei Google acquisizioni
( Wikipedia, elenco delle acquisizioni Google ):
84 3 dicembre 2010 Phonetic Arts Speech Synthesis Regno Unito Google Voice, Google Translate [90]
Altri suggerimenti
Ho fatto un semplice involucro con rubino. https://github.com/c2h2/tts
gem install tts
require 'tts'
'hello world!".to_file "en"
Sarei sorpreso se Google translate sta usando eSpeak. In primo luogo, i risultati sono buoni e mancano molti difetti tipici eSpeak. In secondo luogo, Google è ben noto per essere utilizzando idee come le reti nel profondo del loro gruppo vocale (vedere il lavoro da Geof Hinton e anche http://research.google.com/pubs/SpeechProcessing.html ).
Prova pyttsx
: https://github.com/parente/pyttsx
$ pip install pyttsx
$ python
>>> import pyttsx
>>> e = pyttsx.init()
>>> e.say('haha hahaha haha haha hahaha')
>>> e.runAndWait()
Utilizzare il pyttsx3 del modulo per python3.
semplicemente usare pip install pyttsx3
per l'installazione