質問

私は持っています プログラミング ブルートフォースニューラルネット手法を調査するというタスク(宿題)。問題のその部分は、 私の 宿題。

口頭変換で繰り返される特定の単純な単語が類似しているものとして認識できる可能性があることを示さなければなりません。その単語が何であるかを理解する必要はありません。ただ、それが繰り返される可能性があるというだけです。私を制限するために 「サーチスペース」 WAVファイルを断片に分割したいと考えています。を避けるために、 「ドナルド・クヌース」 RMS や周波数プロファイリングのためのフーリエ解析などの学習にエネルギーを注ぎたくないのです。

そこで、wavファイルを分割するためのWindowsベースのユーティリティを探しています。と呼ばれるものを見てきました GramoFile.exe. 。これは、ビニールプラッター録音を分割したLPソングレベルではうまく機能しますが、小さなスピーチの断片では機能しません。これは、DOS バージョンの Linux ユーティリティです。に分割することに限定されます 99 ファイルのみ。99個のフラグメントに分割し、GramoFile.exeを介して最初、2番目などの分割ファイルを実行しようとしましたが、うまくいきませんでした。単語間のわずかな休止には対応できません。

何か提案はありますか?

役に立ちましたか?

他のヒント

wav は非常にシンプルです。

これは、wav を 2 つの配列 (左チャンネル、右チャンネル) に読み込むために以前に書いた C# スニペットです。そこに配置したら、好きなように分割できます。選択した言語に移植するのは難しくありません。

C# の .wav の平均振幅

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top