すべての音声からテキストへのアルゴリズムはリアルタイムで動作しますか？

https://stackoverflow.com/questions/476299

speech-to-text

20-08-2019
|

質問

現在の技術のすべての音声からテキストへのアルゴリズムはリアルタイムで動作しますか？マイク付きのコンピューターに座っている人ではなく、事前に録音されたオーディオファイルを入力するという意味ではありません。

i.e。 30分間の音声録音がある場合、文字起こしには常に30分かかりますか？

さまざまなアプローチがありますか？

解決

音声認識が実行されるオーディオの長さだけかかる理由はありません。ただし、必要な計算のために、リアルタイムアルゴリズムよりも非常に高速になるとは思わない。詳細情報については、Wikipediaの記事のこのセクションを参照してください（いつでも提供できますが、パフォーマンスのまともな概要を提供します）。

他のヒント

リアルタイムよりも高速にアルゴリズムの実行を停止するものはありません。 Naturally Speaking 10 Professionalソフトウェアプログラムは、<！> quot; transcript from file <！> quot;を提供します。コンピューターから離れている間に取られた口述を変換するためのオプション、これはそれが実行されているコンピューターが達成できる限り速く動作します。

シグナルインテリジェンスの分野にはバッチ処理の実装が存在すると思いますが、当然、こうしたプログラムは一般の人々には利用できません。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow