Pergunta

O Google retorna demais resultados, embora SPUC me chamou a atenção. Existe uma biblioteca padrão recomendada como OpenCV para a visão? As características necessárias seria:

  • Free Open Source
  • projeto do filtro (Butterworth, Chebyshev, etc)
  • FFT
  • se possível, algum discurso processamento de recursos, como MFCC computação, apesar de que é secundário, como eu poderia usar SPTK (sp-tk.sourceforge.net) para essa parte.
Foi útil?

Solução

A Síntese Toolkit, https://ccrma.stanford.edu/software/stk/, tem uma classe que pode modelar diferentes fonemas. Ele também tem ferramentas para todos os tipos de DSP, incluindo diferentes tipos de filtros. Eu recomendo a verificar-se, pois será uma experiência de aprendizagem fantástica Não importa o que você usá-lo.

Outras dicas

Eu usei biblioteca Esfinge da CMU com sucesso.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top