どうすれば最先端のテキストからスピーチを馬鹿げていますか？

https://stackoverflow.com/questions/3757226

04-10-2019
|

質問

昔に戻って、テキストからスピーチは、最先端のように非常に不完全でした。一言で入力したとき、それはあなたがそれをどのように綴ったかをほとんど読んでいたでしょう...単調で。多くの場合、結果は非常に面白いでしょう。今日、テキストからスピーチは、笑いをもたらすことができる方法で愚かさが賢すぎます。

個人的なプロジェクトとして、おもちゃとしてのみ、この古いスタイルのテキストからスピーチを取り戻すことができるアプリケーションを構成したいと思います。 .netでは、私は両方に利用できるようになりました System.Speech.dll そしてその SpeechLib comオブジェクト。（Microsoft Speech Object Library）どちらも、OSが組み込まれたテキストからスピーチを使用しているようです。これらを構成するように構成する方法はありますか？

いくつかの異なる「サヤ」オプションを試してみました。文化を不変（例外！）に設定しようとしましたが、今ではSSMLを見ています。古いテクノロジー自体を見つけなければならないように見え始めていますが、どこから始めればいいのかさえ知りません。

私が見たいと思っている混乱の例として、ここにあなたのためのいくつかのムーンベースアルファがあります： http://www.youtube.com/watch?v=hv6rbeolqro （ヘッドフォンを着ていることを確認してください！）

これらの新しいテキストから病気のコンバーター、ノルマイザー、ケーブルレス携帯電話、...

解決 2

さて、私はちょうど古い「Microsoft Voice Text」ライブラリにつまずくことができました： vtext.dll

これは私が探していたもののようです！最新のTTSライブラリと比較して、インターフェイスは非常に簡単です。結果は、私がリンクしたビデオの声とまったく同じではないようですが、それはおそらく別の実装でした。いずれにせよ、それは思い出させる時です。

var tts = new HTTSLib.TextToSpeech();
tts.Speak("ebrbrbrbrbrbrbrbr");

何らかの理由で、「ここ」と言ってもらうと、vshost.exeがクラッシュします。しかし、これは単なる愚かな個人プロジェクトであるため、私はそれを無視することができます。

他のヒント

あなたはおそらく「NRLアルゴリズム」と呼ばれていたものが欲しいです。 Votrax 1970年代および1980年代の音声シンセサイザー。私の友人が（シリアルポート経由で）オズボーンIに接続した友人の1つを持っていたことを覚えています。たとえば、「コンピューター」が「com poo ter」が出てきました。

または多分それはでしたマイクロボックス私の友人が持っていたこと。それは鐘を鳴らしているようです。当時、すべてのテキストからスピーチボックスは、ほぼ同じテクノロジーを使用していました。リンクされた記事は情報の噴水です。半分の途中で、テキストから音声変換に関する長いセクションがあります。ルールと基本的なアルゴリズムについて説明します。いくつかの研究と実験により、Microvoxの音声統合を複製できると思います。

NRLアルゴリズムは、によって実装されました Unix Speak Command, 、その源は明らかに歴史の大きなバケツに失われています。でも、 MDMCILROY それについての論文を書きました。ルールによる合成英語のスピーチ（スキャンされたページを含むTARファイルです）。

これは、時間があればプレイするのが楽しいプロジェクトです。それに頑張ってください。あなたがそれでどこにでも行くならば、私に知らせてください。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow