Wie kann ich verdummen unsere innovative Text-to-Speech?

https://stackoverflow.com/questions/3757226

04-10-2019
|

Frage

Zurück in den alten Tagen, Text-to-Speech, als Schneidkante, wie es war, war sehr unvollkommen. Wenn Sie in einem Wort eingegeben hat, wäre es ziemlich viel, um es zu lesen, wie Sie es geschrieben ... in monoton. Oft wäre das Ergebnis sehr lustig. Heute, Text-to-Speech zu intelligent ist in einer Weise zu faulenzen, die ein Lachen bringen können.

Als persönliches Projekt, würde Ich mag, eine Anwendung machen, die diesen alten Stil des Textes-zu-Sprache bringen können, wenn auch nur als Spielzeug. In .NET Ich habe sowohl System.Speech.dll und die SpeechLib COM-Objekte zur Verfügung zu mir. (Microsoft Speech Object Library) Beide scheinen die OS in Text-to-Speech gebaut zu verwenden, die wiederum ist zu dang smart. Gibt es Möglichkeiten, diese zu deaktivieren zu konfigurieren, was auch immer es ist, dass macht es intelligent?

Ich habe Optionen ein paar verschiedene ‚SAYAS‘ versucht, ich habe versucht, die Kultur zu invariant Einstellung (Ausnahme!) Und jetzt bei SSML ich suche. Es fängt an zu schauen, wie ich die alte Technik selbst finden müssen, aber ich weiß nicht einmal, wo zu beginnen.

Als Beispiel für das Chaos Ich hoffe, ich, um zu sehen, hier ist etwas Moonbase Alpha für Sie: http://www.youtube.com/watch?v=Hv6RbEOlqRo (Stellen Sie sicher, Sie tragen Kopfhörer!)

Con Fettpölsterchen dieses neumodische Text-Phonem-Wandler und Normalisierer und kabellose Telefone und ...

Lösung 2

Nun, ich schaffte es gerade noch über den alten "Microsoft Voice Text" Bibliothek zu stolpern: vtext.dll

Dies scheint zu sein, was ich gesucht habe! Im Vergleich zu modernen TTS-Bibliotheken ist die Schnittstelle sehr einfach. Das Ergebnis scheint nicht genau das gleiche zu sein wie die Stimme in diesem Video, das ich verbunden, aber das war wahrscheinlich eine andere Implementierung. So oder so, es ist an der Zeit wieder aufleben lassen.

var tts = new HTTSLib.TextToSpeech();
tts.Speak("ebrbrbrbrbrbrbrbr");

Aus irgendeinem Grund stürzt vshost.exe wenn ich es sagen „hier“. Da dies aber nur ein dummes persönliches Projekt ist, ich kann es ignorieren.

Andere Tipps

Sie wollen wahrscheinlich, was die "NRL Algorithm" genannt, die von der Votrax Sprachsynthesizer in den 1970er und 1980er Jahren. Ich erinnere mich an einen Freund von mir einer von denen hatte, dass wir (über serielle Schnittstelle), die mit meinem Osborne I. Wir aus dem Weg viel gelacht habe es „sagte“ Dinge. "Computer" herauskam "com poo ter", zum Beispiel.

Vielleicht war es auch ein MicroVox dass mein Freund hatte. Das scheint eine Glocke zu läuten. Zu der Zeit, die ganzen Text to Speech-Box verwendet, so ziemlich die gleiche Technologie. Der verlinkte Artikel ist eine Quelle von Informationen. Etwa auf halbe Strecke ist unten ein länglicher Abschnitt auf Text-to-Speech-Konvertierung. Es beschreibt die Regeln und die Basis-Algorithmus. Ich, dass vermuten, mit einigen Studien und Experimente, man konnte die MicroVox der Sprachsynthese duplizieren.

Der NRL-Algorithmus wurde von dem Unix spricht Befehl , die Quelle welche offenbar zum großen bit bucket der Geschichte verloren. Allerdings M.D. McIlroy schrieb ein Papier darüber. Synthetic Englisch Rede Regel (es ist eine TAR-Datei gescannten Seiten enthält).

Das wäre ein Spaß-Projekt sein, mit zu spielen, wenn ich die Zeit habe. Viel Glück auf ihm. Lassen Sie uns wissen, wenn Sie überall mit ihm.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow