質問

私はオーディオの世界に慣れていないため、対処方法がわからないタスクを割り当てられました。 WAVファイルのピッチを表すグラフを表示する必要があります。 WAVファイルはポリフォニックである可能性があるため、支配的な(読み取り:最も強い音量で)楽器(または人間の声の歌)のピッチグラフを表示する必要があります。 私は.NETに精通しており、C、C ++、Javaのほとんど何も知っていません。

ウェブで調査を開始しましたが、ポリフォニックWAVファイルのピッチ検出は解決されていない問題であると理解していましたが、正確なピッチは必要ありません。その長さは何ですか。

私の質問:

  1. このタスクの背後にある理論を学ぶために、どこから始めるべきですか?そのための推奨本はありますか?

  2. それを実行できるAPI /ツールはありますか?

ありがとう、

ML

役に立ちましたか?

解決

フーリエ解析を使用して、波の構成周波数を抽出できます。関連するSOの質問は次のとおりです。 C#での高速フーリエ変換

他のヒント

デジタル信号処理で信号処理を開始しました。約30ドルで印刷された本を購入するか、pdfを無料でダウンロードできます。非科学者向けに書かれており、さまざまな信号処理技術を使用して起動して実行するための大量の情報が含まれています。

FFT(高速フーリエ変換)は、時間と振幅の信号を周波数(ビン)と強度(エネルギー)に変換します。多くのWebサイトで見られる標準チャートを使用して、頻度からメモに移動できます。

やや関連するプロジェクトに取り組んでいます。高速フーリエ変換を調査する必要があります。この C#で書かれたプロジェクトをお勧めします-ギターとして書かれていますチューナーですが、目的に合わせて簡単に変更できます。

ただし、これはマルチピッチを行いません。 " celemony "という製品があります。 「ダイレクトノートアクセス(DNA)」を使用してこの機能を持っていると主張しています。その技術は当然のことながらクローズドソースですが、適切な価格でライセンスを取得できる場合があります。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top