質問

MP3 を取得して音声をテキストに変換するにはどうすればよいですか?

会議や会議のメモをいくつか録音しました (録音には私の声が 1 つだけあります)。単純に手書きで書き写すよりも、音声テキスト変換ツールを使用してテキストに変換する方が簡単で知的に興味深いものになるだろうと思いました。特にアスタリスクとポッドキャストを使用した VoIP アプリケーション向けのテクノロジがあることは知っていますが、それらは何ですか?また、どのように使用できるのでしょうか?

役に立ちましたか?

解決

オープンソース: CMU Sphinxの

シェアウェア: http://www.e-speaking.com/ の(Windowsの場合)

商業:ドラゴンNaturallySpeakingのの(Windowsの場合)

他のヒント

.NETそのSystem.Speechの名前空間でそれを行うことができます。

あなたはまずた.wavやマイクからのライブオーディオをキャプチャするために変換する必要があります。

の実装の詳細については、ここで見つけることができます: .NET

とオーディオを転写

ドラゴンNaturallySpeakingのには、MP3入力をサポートするようです。

あなたはオープンソース版をしたい場合は、

(私はいくつかのアスタリスク統合プロジェクトがあると思います)このいずれかに基づいています。

パーティーに遅れたので、今後の参考のためにさらに回答します。

この分野の進歩と Mozilla の考え方と課題により、その目的に向けた次の 2 つのプロジェクトが生まれました。

後者には、ダウンロード用の 12GB データセットがあります。私の理解では、前者では独自のオーディオファイルを使用してモデルをトレーニングできます

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top