どのようにしたいと考える人は多いだろう音声をテキストを使うことができます。

StackOverflow https://stackoverflow.com/questions/14837

質問

私が興味を持っ音声をテキストアルゴリズムがなんなのかが留学を行なっていた。気探っている。 この, では1996年から、私はかなり確実と向上もありそうです。

な人の経験があればこのようなものを勧めの読みのソースコードの検討?ただ一般のアドバイスして学習していただけました世界の音声認識プログラム(ru,キーワード:ハウスの検索ない場合については、ほとんど何も知のです。

編集:思いクロスプラットフォームも、現時点ではさんを対象にプログラムを利用しています。.

編集2:コcsmbaを思い出します。この時点で、私は主に興味があることのできるアプリケーションを制作しを自動化、または実行の異なるコマンドを通します。なので、限られた認識のコマンドができる張す。例えば、音楽プレーヤーがコマンドのような"遊びのアルバムこんにちはもSquarepusher",やアプリケーションランチャーとのできるユーザを作成音声のショートカット上の特定のアプリとなります。

これかの巨大な問題となっていてもレベルにするために必要な知識を今に取り組むの実施全体の認識エンジンは、技術者とその人を魅了しんでいたいと思い自分にとって最しています。すべての可能性なんだろう終わ持ち直しの本は、学ぶ上で遊んで"簡単に"実は私の自由時間。

役に立ちましたか?

解決

これは大きな問題なかったであろうか。いについてお話ししましょう試みに"本規約"だからで絞り込むことができ探求:

まず、この音声認識は多様化-複雑な対象、数多く提供いたします。人々がこのドメイン地図にまず自分の頭の(通常は、どちらかというとコンピュータの理解に何を言うようにIVRシステム)だ。できdistinguiseのコンセプトの主なカテゴリ:

人間を機械: の応用を扱うのが何なのかを理解する人はいるが、人間を知っているのが当たり前ですが、機械の 文法 は非常に限られている。例

  • コンピュータの自動化
  • 専門:パイロットの自動化は一部のコントロールは、例えばノイズの大きな問題)
  • IVR(自動音声応答システムのようなGoogle-411またはご利用いただきますと、銀行、コンピュータには"言いたいことは、"サービスをお客様サービス"

により、人 (話し言葉音声):これはより多くの複雑な問題です。ここまで別applciations:

  • コールセンター:会話エージェントは、お客様の電話品質圧縮
  • 知:無線/電話/ライブ会話の間に2つ以上の個人

現在、音声をテキストは何をするべきことはいうます。うご注解決問題である。異なる技術を解決するために用いられ異なる。見概要 こちらの の紹介されています。このように、他のアプローチの音声の転LVCSR、直接ます。

ものに興味がありますの博士後ろのでしょうか?する必要があり、修士と同等に関 信号処理 とくに博士号を切ります。その場合、作業を開発する企業の実際 音声エンジン.企業のようなニュアンスおよびIBMの大きなものを、フィリップスやその他のスタートアップが存在します。

他方、ご覧いただきますの実施に応用することができ、エンジンが、建築にアプリをご利用のエンジンです。いいえいいと思う形のゲーム産業お開発途上のグラフィックエンジンの泣きのエンジン)は、一つの作品を作るのに数百ゲーム、すべて同じグラフィックエンジン?

なくて間違いあたっぷりの品質の検索も外アイ-ビー-エム/ニュアンスの世界です。エンジンは通常、非常に開放し、多くのアルゴリズム調整を行うことにより、飛躍的には影響します。各事業の申請と異なる制約と費用対効果の機能をすることができるので実験を長年にわたって音声認識ベースのアプリケーション.

一:一般的に、おもいって良い統計の背景の下、スタックしたいです。

この時点で、私は主に興味があることのできるアプリケーションを制作しを自動化

い、収束はこちら---しかし、興味のない"音声になります。その流行語に世界の全転写因子、する必要はない。きに焦点を当てて行く予定ですのにより、より人間的でナチュラル-ツー-マシン技術のような声はXMLを使IVRシステムズ(ニュアンス最大のプレイヤーがあり)

他のヒント

エクスペディアをおすすめする持ち直し 書籍 た場合はございますのでご注意下さい。私の経験の分野でいくます。まだ大学(やまだてのつながりばを見る場合の教授できます。

調査まで同定することができることがあ優れた資源です。思が進んできたのはこの1996年以降、その基礎とは根本的に変更します。その結果も記述でもお時間を読みます。

OS Xを確認す: OS Xでの音声技術

Windows用のチェックす: Microsoft Speech API

実環境で期待通りに動作し、 非常にインターナショナルViaVoice製品.の良い音声認識(自動音声認識エンジンのカフェやコンビニ、近くのホテルの音声読み上げエンジンです。

本サイトの良くないが、これはリンクの組み込みバージョン http://www-01.ibm.com/software/voice/support/

では、プラットフォームagnosticが、すべての作品を通してMVC建築用vxmlのバリアントxmlのための音声です。

どのプラットフォームまを対象に?.はありま Microsoft Speech Api 利用できる場合は、windowsの場合です。

あるもの 音声認識サービス Android.

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top