Comment utiliser la reconnaissance vocale avec / sur le fichier vidéo?
-
19-09-2019 - |
Question
Comment puis-je le moteur de reconnaissance vocale de code (en utilisant Microsoft Speech SDK) pour « écouter » un fichier vidéo et enregistrer la détection dans un fichier?
La solution
Ceci est très similaire à href="https://stackoverflow.com/questions/1499608/transcribing-wma-mp3-audio-in-an-automated-fashion/1665318#1665318"> et a une réponse très similaire. Vous devez séparer la partie audio, le convertir au format WAV, et l'envoyer à un reconnaisseur inproc.
Cependant, il a les mêmes problèmes que je décrit précédemment (nécessite une formation, suppose une seule voix, et prend le microphone est proche du haut-parleur). Si tel est le cas, alors vous pouvez probablement obtenir des résultats raisonnablement bons. Si ce n'est pas le cas (par exemple, vous essayez de retranscrire une émission de télévision, ou pire, une sorte audio du caméscope), les résultats seront probablement pas satisfaisant.