Domanda

Google restituisce troppi risultati, sebbene SPUC ha attirato la mia attenzione. Esiste una libreria standard raccomandata come OpenCV per la visione? Le caratteristiche necessarie sarebbero:

  • Free Open Source
  • progettazione del filtro (Butterworth, Chebyshev, ecc.)
  • FFT
  • se possibile, alcune funzionalità di elaborazione vocale, come il calcolo MFCC, anche se questo è secondario, poiché potrei usare SPTK (sp-tk.sourceforge.net) per quella parte.
È stato utile?

Soluzione

The Synthesis Toolkit, https://ccrma.stanford.edu/software/stk/, ha una classe che può modellare diversi fonemi. Ha anche strumenti per tutti i tipi di DSP, inclusi diversi tipi di filtri. Consiglio di provarlo perché sarà una fantastica esperienza di apprendimento, indipendentemente da cosa lo usi.

Altri suggerimenti

Ho usato libreria Sphinx di CMU con successo.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top