Pregunta

Estoy pensando en escribir un programa para Linux que utiliza el texto a voz y reconocimiento de voz.¿Cuáles son las mejores herramientas y bibliotecas para esto?Debo usar Windows en lugar de ser capaz de utilizar mejor las herramientas?Las herramientas deben ser fácilmente se puede llamar desde una consola o C programa.

¿Fue útil?

Solución

Para el reconocimiento de voz no son los diversos Esfinges . Las diferentes variantes tienen diferentes ventajas y desventajas, hay una comparación aquí Comparación de versiones Sphinx . Sphinx 4 es Java, pero los otros son C, creo.

Otros consejos

Depende un poco de lo que habla que usted está tratando de reconocer.

Este es un artículo de 2005 que explica algunas de las dificultades en la creación de un programa de dictado: http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html . Si quieres que la rel="nofollow motor de reconocimiento de voz Julius parece prometedor, pero se necesita añadir su propios modelos acústicos y de lenguaje. Usted puede ser capaz de utilizar el href="http://www.voxforge.org/" rel="nofollow noreferrer"> VoxForge modelo acústico

Si usted no está tratando de escribir un programa de dictado entonces usted tiene una tarea mucho más fácil. programas de mando tienen un vocabulario limitado, por ejemplo, 'Si le gustaría continuar en Inglés, diga 'Inglés''.

yo era capaz de obtener muy buenos resultados utilizando pocketsphinx y gstreamer para hacer un programa que automáticamente edita la mayoría de las apariciones de la palabra " gorjeo " fuera de la TWiT podcast. No funcionó en absoluto hasta que usé mi propio modelo de lenguaje basado en las transcripciones de podcast; las transcripciones de la máquina del reconocedor de voz son inútiles / hilarante, pero hacen un trabajo bien de encontrar la palabra clave.

Para el reconocimiento de voz existe muy poco para Linux. Yo fuera consciente de una opción aparentemente decente, algo que IBM lanzó hace unos años, pero más tarde ya no estaba disponible (alguien sabe si este SDK ViaVoice todavía es posible conseguir desde cualquier lugar?). Hay algo más de información acerca de las posibles opciones en Wikipedia .

he utilizado tanto Loquendo y Festival bajo Linux. Yo consideraría las voces del festival que he utilizado bastante pobre, con la síntesis muy robótico. Las voces de Loquendo, por el contrario, son excelentes - muy alta calidad.

Para Debian / Ubuntu de texto-a-voz también hay SVOX Pico:

sudo apt-get install libttspico-utils

eSpeak es un muy buen programa de texto a voz para Linux (que incluso puede hacer diferentes acentos!), pero no tenemos información disponible sobre los sistemas de reconocimiento de voz diseñados para UNIX.

AT & T kit de herramientas FSM también es bastante impresionante - no al uso comercial permitido, sin embargo,

http://www.research.att.com/~fsmtools/fsm/

Esto es un poco viejo, pero vi que una guía bastante completa sobre el reconocimiento de voz en Hackaday hace unos días: http://hackaday.com/2010/07/09 / Get-comenzó-con-reconocimiento de voz /

http://simon-listens.org/ - Simon habla de código abierto / programa de reconocimiento de voz

Y luego está mbrola de texto a voz.

¿Comprobaste el basado en HMM síntesis de voz de texto a voz.Usted puede encontrar el demo gratuita en el sitio web http://hts.sp.nitech.ac.jp/.La instalación será un poco tedioso.

La pregunta original sobre la búsqueda de bibliotecas adecuadas, lo sé, pero desde tan lejos como el uso de reconocimiento de voz lo suficientemente bueno para el dictado real, no parece haber nada que hay para Linux (aunque estoy seguro de que va a cambiar en el tiempo, sospechamos que tomará un tiempo, ya que no estoy seguro de que muchas personas están interesadas).

En el momento que estoy tratando de promover Dragon NaturallySpeaking como un producto con el apoyo de CodeWeavers ... así que si usted está interesado como un usuario que ayudaría si desea emitir un voto ...

http://www.codeweavers.com/compatibility/browse/name /? APP_ID = 8427

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top