¿Alguien puede recomendar una biblioteca de DSP / voz decente en C ++? [cerrado]

https://stackoverflow.com/questions/1615634

06-07-2019
|

Pregunta

Google devuelve demasiados resultados, aunque SPUC me llamó la atención. ¿Existe una biblioteca estándar recomendada como OpenCV para la visión? Las características necesarias serían:

Free Open Source
diseño del filtro (Butterworth, Chebyshev, etc.)
FFT
si es posible, algunas funciones de procesamiento de voz, como el cálculo de MFCC, aunque eso es secundario, ya que podría usar SPTK (sp-tk.sourceforge.net) para esa parte.

Solución

El kit de herramientas de síntesis, https://ccrma.stanford.edu/software/stk/, tiene una clase que puede modelar diferentes fonemas. También tiene herramientas para todo tipo de DSP, incluyendo diferentes tipos de filtros. Recomiendo comprobarlo, ya que será una experiencia de aprendizaje fantástica, sin importar para qué se use.

Otros consejos

He utilizado biblioteca Sphinx de CMU con éxito.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow