Frage

Ich bin neu in der Audiowelt, und ich habe eine Aufgabe zugewiesen wurde, ich bin nicht sicher, wie zu behandeln. Ich brauche eine Grafik anzuzeigen, die Tonhöhe einer WAV-Datei repräsentiert. Die WAV-Datei kann polyphone sein, und dann muß ich die Tonhöhe Diagramm der dominanten anzuzeigen (sprich: mit dem stärksten Volumen) Instrument (oder menschliche Stimme singen). Ich bin sehr vertraut mit .NET und weiß so gut wie nichts in C, C ++, Java.

begann ich eine Forschung auf dem Netz, und von dem, was ich Tonhöhenerkennung von polyphonen WAV-Dateien zu verstehen ist ein Problem nicht gelöst, aber ich weiß nicht, die genaue Tonhöhe muß, nur um zu wissen, ob es höher von dem nächsten ist, und was ist seine Länge.

Meine Fragen sind:

  1. Wo soll ich für das Erlernen der Theorie hinter dieser Aufgabe beginnen? Gibt es empfohlene Bücher für das?

  2. Gibt es ein API / Tool, das das tun können?

Danke,

ML

War es hilfreich?

Lösung

Sie können Fourier-Analyse verwenden, um die konstituierenden Frequenzen der Welle zu extrahieren. Hier ist eine verwandte Frage SO: schnelle Fourier-Transformation in C #

Andere Tipps

Ich begann auf Signalverarbeitung mit Digital Signal Processing . Sie können das Buch für rund $ 30 gedruckt kaufen, oder die pdf kostenlos herunterladen. Es ist für Nicht-Wissenschaftler geschrieben und enthält eine Menge Informationen, die Sie und lief mit verschiedenen Signalverarbeitungstechniken zu erhalten.

FFT (schnelle Fourier-Transformation) wird eine Zeit vs Amplitudensignal in eine Frequenz (bins) gegen die Intensität (Energie) umwandeln. Sie können über Standard-Charts auf einer Vielzahl von Websites gefunden .

Ich habe auf einem etwas ähnliches Projekt gearbeitet. Sie wollen schnelle Fourier-Transformationen untersuchen. Ich kann diese Projekt in C # geschrieben - es als eine Gitarre geschrieben Tuner, aber es kann zu Ihrem Zweck leicht geändert werden.

Dies ist jedoch nicht tun, Multi-Feld. Es ist ein Produkt „ Celemony “, die diese Fähigkeit haben behauptet, „Direct Note Access (DNA )“. Ihre Technologie ist verständlicherweise Closed-Source, aber Sie können es zu lizenzieren der Lage sein, zum richtigen Preis.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top