¿Puedo usar SAPI directamente para convertir la voz en texto de audio almacenado en tiempo real
-
01-10-2019 - |
Pregunta
Lo que realmente quiero lograr es esto -> Supongamos que reproducir un archivo de audio (usando mi solicitud) que, o bien se puede transmitir a través de Internet / o accede directamente desde el almacenamiento local. Ahora quiero SAPI de configuración para escuchar a esta fuente en lugar del micrófono y convertir el discurso desde el audio a texto como lo hace normalmente.
Solución
No creo SAPI soportes esto en sí.
Hay algunos enfoques que podría utilizar que son "externos" a SAPI:
-
Obtener un macho a macho cable de miniconector conecte la salida de la tarjeta de sonido en la entrada de la tarjeta de sonido
-
Virtual Audio Cable que logra básicamente # 1, pero con Virtual software de la tarjeta de sonido en lugar de hardware. Puede ser muy difícil al principio para entender cómo funciona Virtual Audio Cable y cómo usarlo, pero funciona muy bien una vez que figura a cabo.
-
Algunas tarjetas de sonido tienen una característica integrada de bucle de retorno, lo que le permite grabar lo que la tarjeta de sonido está jugando en lugar de grabar a partir de, por ejemplo, un micrófono. Estos son algunos enlaces buena info: Lo que se oye y Stereo Mix . También tratar de buscar en Google los términos para obtener más información.
Otros consejos
Sólo WAV parece estar apoyada fuera de la caja - Ver aquí
Citando:
El escenario de entrada de archivo WAV es especial, ya que utiliza controlado, entrada de audio reproducible y requiere un motor SR dedicado, sin interferencia de otras aplicaciones (por ejemplo, un micrófono de escritorio compartido). El escenario de entrada de archivo debe utilizar un flujo de audio SAPI genérica conectada a la entrada de archivo de sonido y un motor InProc SR.