質問

これは90年代後半からです... http://www.cs.princeton.edu/~prc/singingsynth.html

なぜこれが離陸しなかったのですか? (私たちはフォトリアリスティックなような画像を合成できますが、歌の統合はまだ非常に原始的な段階にあるようです)。

歌の統合を困難にするのは正確に何ですか?

http://www.interspeech2007.org/technical/synthesis_of_singing_challenge.php < - まだ原始的なようです。

役に立ちましたか?

解決

私の気持ちは、画像よりも簡単にサウンドのために不気味な谷に入るということです。私たちの脳は、ひどく形成されたイメージを比較的よく受け入れますが、自然に聞こえない限り、ひどく形成された音を受け入れません。完全に不足していないように聞こえるものはすべて不気味に聞こえます。これは、実際のアプリケーションに対して非常に強い障壁になります。発表や電話サービスに適していますが、完全に合成的な歌から長い道のりです。

一方、実際の声の変更は、ライブとスタジオの両方で毎日実行されます。それなし オートチューン そこにいるすべての「ギャングスタ」と「レディー・ガガス」は、彼らの実際の才能により適した仕事をするでしょう。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top