質問
私はオーディオの世界に慣れていないため、対処方法がわからないタスクを割り当てられました。 WAVファイルのピッチを表すグラフを表示する必要があります。 WAVファイルはポリフォニックである可能性があるため、支配的な(読み取り:最も強い音量で)楽器(または人間の声の歌)のピッチグラフを表示する必要があります。 私は.NETに精通しており、C、C ++、Javaのほとんど何も知っていません。
ウェブで調査を開始しましたが、ポリフォニックWAVファイルのピッチ検出は解決されていない問題であると理解していましたが、正確なピッチは必要ありません。その長さは何ですか。
私の質問:
-
このタスクの背後にある理論を学ぶために、どこから始めるべきですか?そのための推奨本はありますか?
-
それを実行できるAPI /ツールはありますか?
ありがとう、
ML
解決
フーリエ解析を使用して、波の構成周波数を抽出できます。関連するSOの質問は次のとおりです。 C#での高速フーリエ変換
他のヒント
やや関連するプロジェクトに取り組んでいます。高速フーリエ変換を調査する必要があります。この C#で書かれたプロジェクトをお勧めします-ギターとして書かれていますチューナーですが、目的に合わせて簡単に変更できます。
ただし、これはマルチピッチを行いません。 " celemony "という製品があります。 「ダイレクトノートアクセス(DNA)」を使用してこの機能を持っていると主張しています。その技術は当然のことながらクローズドソースですが、適切な価格でライセンスを取得できる場合があります。
所属していません StackOverflow