¿Puedo usar SAPI directamente para convertir la voz en texto de audio almacenado en tiempo real

https://stackoverflow.com/questions/3569002

01-10-2019
|

Pregunta

Lo que realmente quiero lograr es esto -> Supongamos que reproducir un archivo de audio (usando mi solicitud) que, o bien se puede transmitir a través de Internet / o accede directamente desde el almacenamiento local. Ahora quiero SAPI de configuración para escuchar a esta fuente en lugar del micrófono y convertir el discurso desde el audio a texto como lo hace normalmente.

Solución

No creo SAPI soportes esto en sí.

Hay algunos enfoques que podría utilizar que son "externos" a SAPI:

Obtener un macho a macho cable de miniconector conecte la salida de la tarjeta de sonido en la entrada de la tarjeta de sonido
Virtual Audio Cable que logra básicamente # 1, pero con Virtual software de la tarjeta de sonido en lugar de hardware. Puede ser muy difícil al principio para entender cómo funciona Virtual Audio Cable y cómo usarlo, pero funciona muy bien una vez que figura a cabo.
Algunas tarjetas de sonido tienen una característica integrada de bucle de retorno, lo que le permite grabar lo que la tarjeta de sonido está jugando en lugar de grabar a partir de, por ejemplo, un micrófono. Estos son algunos enlaces buena info: Lo que se oye y Stereo Mix . También tratar de buscar en Google los términos para obtener más información.

Otros consejos

Sólo WAV parece estar apoyada fuera de la caja - Ver aquí

Citando:

El escenario de entrada de archivo WAV es especial, ya que utiliza controlado, entrada de audio reproducible y requiere un motor SR dedicado, sin interferencia de otras aplicaciones (por ejemplo, un micrófono de escritorio compartido). El escenario de entrada de archivo debe utilizar un flujo de audio SAPI genérica conectada a la entrada de archivo de sonido y un motor InProc SR.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow