Frage

Google liefert zu viele Ergebnisse, obwohl SPUC meine Aufmerksamkeit erregte. Gibt es eine Standard empfohlene Bibliothek wie OpenCV für Vision? Die erforderlichen Eigenschaften wären:

  • Free Open Source
  • Filter-Design (Butterworth, Chebyshev, etc.)
  • FFT
  • , wenn möglich, einige Sprachverarbeitungsfunktionen, wie MFCC Berechnung, obwohl das sekundär, wie ich SPTK (sp-tk.sourceforge.net) für diesen Teil nutzen könnte.
War es hilfreich?

Lösung

Die Synthese Toolkit, https://ccrma.stanford.edu/software/stk/, hat eine Klasse, die unterschiedlichen Phoneme modellieren kann. Es hat auch Werkzeuge für alle Arten von DSP einschließlich verschiedenen Arten von Filtern. Ich empfehle checking it out, da es egal eine fantastische Lernerfahrung sein wird, was Sie es verwenden für.

Andere Tipps

ich verwendet habe, CMU Sphinx Bibliothek mit Erfolg.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top