Pregunta

Solo necesito una biblioteca de reconocimiento de voz en Linux.Luego, elijo CMU Sphinx, y use PocketsPhinx con Python.Prueba eso Demo .Este ejemplo funciona bien en mi computadora con una precisión deficiente.


Sé que necesito un modelo de idioma, y lo he descargado.Entonces, cómo configurar mi pocketsphinx usa ese 'lm'.Quiero decir, cómo solucionar ese archivo de demostración para usar ese modelo de idioma.(y modelo acústico.)

¡Muchas gracias!

¿Fue útil?

Solución

El modelo de idioma está configurado a través de la propiedad del componente de PocketSphinx GSTEAMER.En lugar de

   gst.parse_launch('gconfaudiosrc ! audioconvert ! audioresample '
                    + '! vader name=vad auto-threshold=true '
                    + '! pocketsphinx name=asr ! fakesink')

Uso

   gst.parse_launch('gconfaudiosrc ! audioconvert ! audioresample '
                    + '! vader name=vad auto-threshold=true '
                    + '! pocketsphinx lm=<your_file.lm> name=asr ! fakesink')

También puede configurar otras propiedades del componente PocketsPhinx también.Use GST-INSPECT para leer la lista.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top