質問
私は、非圧縮AIFFオーディオファイルで沈黙の検出を行うために結びついています。私はPythonでそれをすることを好みますが、これが非常に非効率的であれば、他のオプションを考慮します。私が扱っている非圧縮ファイルは、20 MB(最大サイズ)になると予想されます。
私は信号処理の基本を理解することができますが、それの専門家ではありません。
解決
あなたは幸運です! AIFC 図書館は、問題の解決をサポートするのに十分なようです。
他のヒント
言語に依存しない擬似コード:
- 各時間枠(たとえば10ミリ秒)
- 時間ウィンドウでRMS電源を計算します
- Silence = rms Power <Silenceしきい値
RMSパワーを計算するには:
- sum_sq = 0
- nサンプルウィンドウの各サンプルについて
- sum_sq += sample^2
- rms power = sqrt(sum_sq / n)
また、おそらく、さらに検出の層を追加したいと思うでしょう。たとえば、サイレンス= m連続したサイレントウィンドウを決定します。ここでは、Mが実際の沈黙としてカウントされるまで沈黙が必要な期間を決定します。
所属していません StackOverflow