Comment configurer un serveur de reconnaissance vocale?

https://stackoverflow.com/questions/8906792

29-10-2019
|

Question

Comment implémenter la reconnaissance vocale du côté serveur (veuillez ne pas suggérer HTML5's x-webkit-speech, javascript, etc.)? Le programme prendra un fichier audio en entrée et avec une précision suffisante fournit la transcription de texte du fichier audio. Quelles sont les options que je peux utiliser?

J'ai essayé de mettre en œuvre Sphin4 avec modèle voxforge Mais la précision est si mauvaise (ce peut être aussi un problème dans ma configuration, j'essaie toujours de l'apprendre). Dans un article, j'ai lu que lorsque nous utilisons <input name="speech" id="speech" type="text" x-webkit-speech /> l'entrée est envoyée à un serveur externe et ce serveur que le fait le reconnaissance et renvoie les données au navigateur.

Comment puis-je configurer ce serveur? Tout serveur open source existant serait également utile s'il peut reconnaître les phrases en anglais avec un taux d'erreur minimal.

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow