Pregunta

Google devuelve demasiados resultados, aunque SPUC me llamó la atención. ¿Existe una biblioteca estándar recomendada como OpenCV para la visión? Las características necesarias serían:

  • Free Open Source
  • diseño del filtro (Butterworth, Chebyshev, etc.)
  • FFT
  • si es posible, algunas funciones de procesamiento de voz, como el cálculo de MFCC, aunque eso es secundario, ya que podría usar SPTK (sp-tk.sourceforge.net) para esa parte.
¿Fue útil?

Solución

El kit de herramientas de síntesis, https://ccrma.stanford.edu/software/stk/, tiene una clase que puede modelar diferentes fonemas. También tiene herramientas para todo tipo de DSP, incluyendo diferentes tipos de filtros. Recomiendo comprobarlo, ya que será una experiencia de aprendizaje fantástica, sin importar para qué se use.

Otros consejos

He utilizado biblioteca Sphinx de CMU con éxito.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top