Frage

Also das aus den späten 90er Jahren ist ... http: // www. cs.princeton.edu/~prc/SingingSynth.html

Warum hat das nicht genommen? (Wir können wie Bilder fotorealistische synthetisieren, aber die Synthese von Gesang ... scheint immer noch in sehr primitiven Stadien zu sein).

Was genau ist es, das macht die Synthese von Gesang schwierig?

http://www.interspeech2007.org/Technical/synthesis_of_singing_challenge.php . <- noch scheint primitive

War es hilfreich?

Lösung

Mein Gefühl ist, dass wir in das unheimliche Tal für Geräusche leichter zu bekommen als für Bilder. Während unser Gehirn relativ gut ein schlecht ausgebildetes Bild akzeptiert, akzeptiert es nicht schlecht gebildet Ton, wenn es natürlich klingt. Alles, was nicht perfekt unperfect Sounds klingt gruselig, und das macht eine sehr starke Barriere für tatsächliche Anwendungen. Es ist gut für Ansagen und Telefondienste, aber wir sind weit davon entfernt, vollständig synthetischer Gesang.

Auf der anderen Seite, Änderung der tatsächlichen Stimmen wird täglich sowohl durchgeführt, Live und im Studio. Ohne Autotune alle "gangsta" und "Lady Gagas" da draußen einen Job tun würde mehr auf ihre eigentliche Begabung.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top