Cómo utilizar el reconocimiento de voz con / en el archivo de vídeo?

https://stackoverflow.com/questions/1700651

c++
video
speech-recognition

19-09-2019
|

Pregunta

¿Cómo puedo motor de reconocimiento de voz de código (Uso de Microsoft Speech SDK) para "escuchar" un archivo de vídeo y guardar la detección en un archivo?

Solución

Esto es muy similar a esta pregunta y tiene una respuesta muy similar. Es necesario separar la parte de audio, convertirlo a formato WAV, y enviarlo a un reconocedor inproc.

Sin embargo, tiene los mismos problemas que he descrito antes (requiere entrenamiento, asume una sola voz, y asume el micrófono está cerca del altavoz). Si ese es el caso, entonces es probable que pueda obtener resultados razonablemente buenos. Si ese no es el caso (es decir, que está tratando de transcribir un programa de televisión, o peor, una especie de cámara de vídeo de audio), entonces los resultados serán probablemente insatisfactoria.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow