Comment utiliser la reconnaissance vocale avec / sur le fichier vidéo?

https://stackoverflow.com/questions/1700651

19-09-2019
|

Question

Comment puis-je le moteur de reconnaissance vocale de code (en utilisant Microsoft Speech SDK) pour « écouter » un fichier vidéo et enregistrer la détection dans un fichier?

La solution

Ceci est très similaire à href="https://stackoverflow.com/questions/1499608/transcribing-wma-mp3-audio-in-an-automated-fashion/1665318#1665318"> et a une réponse très similaire. Vous devez séparer la partie audio, le convertir au format WAV, et l'envoyer à un reconnaisseur inproc.

Cependant, il a les mêmes problèmes que je décrit précédemment (nécessite une formation, suppose une seule voix, et prend le microphone est proche du haut-parleur). Si tel est le cas, alors vous pouvez probablement obtenir des résultats raisonnablement bons. Si ce n'est pas le cas (par exemple, vous essayez de retranscrire une émission de télévision, ou pire, une sorte audio du caméscope), les résultats seront probablement pas satisfaisant.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow