Question

Google renvoie trop de résultats, même si SPUC a retenu mon attention. Existe-t-il une bibliothèque standard recommandée telle que OpenCV pour la vision? Les fonctionnalités nécessaires seraient:

  • Open Source libre
  • conception du filtre (Butterworth, Chebyshev, etc.)
  • FFT
  • Si possible, certaines fonctionnalités de traitement de la parole, telles que le calcul MFCC, sont secondaires, car je pourrais utiliser SPTK (sp-tk.sourceforge.net) pour cette partie.
Était-ce utile?

La solution

Synthesis Toolkit, https://ccrma.stanford.edu/software/stk/, a une classe qui peut modéliser différents phonèmes. Il propose également des outils pour toutes sortes de DSP, y compris différents types de filtres. Je vous recommande de le vérifier car ce sera une expérience d'apprentissage fantastique, peu importe votre utilisation.

Autres conseils

J'ai utilisé la bibliothèque Sphinx de la CMU avec succès.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top