Domanda

La maggior parte di voi probabilmente conoscono il sintetizzatore text-to-speech di Google Translate, come è possibile accedere a livello di codice qui btw:

http://translate.google.com/translate_tts?tl=en&q=text

La mia impressione è che è a volte usando eSpeak, ma nelle principali lingue, la qualità è molto migliore di quella. Qualcuno sa quello che Google sta usando, o che voci stanno usando? Chiaramente non è la normale e anche non i MBROLA eSpeak voci.

È stato utile?

Soluzione

vorrei cercare nella lista dei Google acquisizioni
( Wikipedia, elenco delle acquisizioni Google ):

84 3 dicembre 2010 Phonetic Arts Speech Synthesis Regno Unito Google Voice, Google Translate [90]

Altri suggerimenti

Ho fatto un semplice involucro con rubino. https://github.com/c2h2/tts

gem install tts
require 'tts'
'hello world!".to_file "en"

Prova questo:

Discorso Util

E'gratuito, ma solo per l'inglese.

Sarei sorpreso se Google translate sta usando eSpeak. In primo luogo, i risultati sono buoni e mancano molti difetti tipici eSpeak. In secondo luogo, Google è ben noto per essere utilizzando idee come le reti nel profondo del loro gruppo vocale (vedere il lavoro da Geof Hinton e anche http://research.google.com/pubs/SpeechProcessing.html ).

Prova pyttsx: https://github.com/parente/pyttsx

$ pip install pyttsx
$ python
>>> import pyttsx
>>> e = pyttsx.init()
>>> e.say('haha hahaha haha haha hahaha')
>>> e.runAndWait()

Utilizzare il pyttsx3 del modulo per python3.

semplicemente usare pip install pyttsx3 per l'installazione

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top