¿Cómo puedo embrutecer nuestra vanguardista de texto a voz?

https://stackoverflow.com/questions/3757226

04-10-2019
|

Pregunta

En los viejos días, texto-a-voz, como de vanguardia como lo fue, era muy imperfecta. Cuando se escribió en una palabra, sería más o menos leer cómo la deletreó ... en un solo tono. A menudo, el resultado sería muy divertido. Hoy en día, texto a voz es demasiado inteligente para meter la pata de manera que pueden traer una risa.

Como proyecto personal, me gustaría hacer una aplicación que puede traer de vuelta este viejo estilo de texto-a-voz, aunque sólo sea como un juguete. En .Net, tengo a mi disposición tanto System.Speech.dll y los objetos COM SpeechLib. (Voz de Microsoft biblioteca de objetos) Ambos parecen utilizar el sistema operativo incorporado en el texto a voz, que a su vez, es demasiado Dang inteligente. ¿Hay maneras de configurar estos para desactivar lo que sea que hace que sea inteligente?

He probado unas cuantas opciones diferentes '' Sayas, He tratado de establecer la cultura de invariantes (excepción!), Y ahora estoy mirando a SSML. Se está empezando a parecer voy a tener que encontrar la vieja tecnología en sí misma, pero ni siquiera saben por dónde empezar allí.

Como un ejemplo del caos que estoy esperando ver, aquí hay algo de la Base Lunar Alfa para usted: http://www.youtube.com/watch?v=Hv6RbEOlqRo (Asegúrese de que está usando los auriculares!)

Con flacidez estos novedosos conversores de texto a fonema, y ??normalizadores, y teléfonos sin cables, y ...

Solución 2

Bueno, sólo logró toparse con el viejo "Texto Microsoft Voz" biblioteca: vtext.dll

Esto parece ser lo que estaba buscando! En comparación con las bibliotecas modernas TTS, la interfaz es muy simple. El resultado no parece ser exactamente la misma que la voz en ese video he vinculado, pero que era probablemente una implementación diferente. De cualquier manera, es el momento para recordar el pasado.

var tts = new HTTSLib.TextToSpeech();
tts.Speak("ebrbrbrbrbrbrbrbr");

Por alguna razón que se estrelle vshost.exe cuando yo le haga decir "aquí". Pero como esto es sólo un proyecto personal mudo, puedo ignorarlo.

Otros consejos

Es posible que desee lo que se llamó el "Algoritmo de NRL", que fue utilizado por el Votrax sintetizadores de voz en los años 1970 y 1980. Recuerdo que un amigo mío tenía uno de los que nos conectado (a través del puerto serie) para mi Osborne I. Tenemos un montón de risas a cabo de la forma en que "dijo" cosas. "PC" salió "com caca ter", por ejemplo.

O tal vez fue un MicroVox que mi amigo tenía. Eso parece que llamar al timbre. En ese momento, todo el texto a las cajas de voz utiliza más o menos la misma tecnología. El artículo enlazado es una fuente de información. A mitad de camino hacia abajo es una sección alargada en la conversión de texto a voz. En él se describen las reglas y el algoritmo básico. Sospecho que, con un poco de estudio y experimentación, se podría duplicar la síntesis de voz del MicroVox.

El NRL algoritmo fue implementado por el Unix comando hablar , la fuente de que es aparentemente perdido a la gran papelera de bits de la historia. Sin embargo, M. D. McIlroy hecho un estudio al respecto. sintético habla Inglés por regla (es un archivo de alquitrán que contiene páginas escaneadas).

Este sería un proyecto divertido para jugar si tuviera el tiempo. Buena suerte en él. Déjeme saber si usted consigue en cualquier parte de la misma.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow