أصوات محرك الكلام من Google؟
سؤال
من المحتمل أن يعرف معظمكم مزج النص إلى كلام من Google ، حيث يمكنك الوصول برمجيًا هنا راجع للشغل: راجع للشغل:
http://translate.google.com/translate_tts?tl=en&q=text
كان انطباعي يستخدم في بعض الأحيان ESPEAK ، ولكن في اللغات الرئيسية ، تكون الجودة أفضل بكثير من ذلك. أي شخص يعرف ما الذي تستخدمه Google ، أو الأصوات التي يستخدمونها؟ من الواضح أنه ليس الطبيعي وأيضًا ليس أصوات MBROLA ESPEAK.
المحلول
سأبحث في قائمة عمليات الاستحواذ على Google
(ويكيبيديا ، قائمة عمليات الاستحواذ على Google):
84 ديسمبر 3 ، 2010 الفنون الصوتية توليف الكلام UK Google Voice ، Google Translate [90
نصائح أخرى
لقد صنعت غلافًا بسيطًا مع روبي. https://github.com/c2h2/tts
gem install tts
require 'tts'
'hello world!".to_file "en"
سأفاجأ إذا كانت Google Translate تستخدم Espeak. أولاً ، النتائج جيدة جدًا وتفتقر إلى العديد من عيوب ESPEAK النموذجية. ثانياً ، من المعروف أن Google تستخدم أفكارًا مثل الشباك العميقة في مجموعة الكلام الخاصة بهم (انظر العمل بواسطة Geof Hinton وأيضًا http://research.google.com/pubs/speechprocessing.html).
محاولة pyttsx
: https://github.com/parente/pyttsx
$ pip install pyttsx
$ python
>>> import pyttsx
>>> e = pyttsx.init()
>>> e.say('haha hahaha haha haha hahaha')
>>> e.runAndWait()
استخدم ال Pyttsx3 وحدة لبيثون 3.
فقط استخدم pip install pyttsx3
للتثبيت