Comment pourrais-je créer un diaporama à commande vocale à l'aide IMAO et impress.js?

https://stackoverflow.com/questions/8845221

27-10-2019
|

Question

Je veux créer une commande vocale diaporama en utilisant l'API IMAO du MIT (ou une autre API de reconnaissance vocale) et impress.js. Je veux inclure des commandes simples comme « page suivante » ou « revenir en arrière ».

Serait-il possible? Comment pourrais-je le faire?

La solution

Il est un autre poste à stackoverflow pose une question très similaire, mais ils voulaient utiliser l'API Speech reconnaissance de Google. Il y a une très bonne réponse à cette question là.

Il y a aussi une nouvelle Speech API dans Chrome qui pourrait être utilisé. Le problème avec cette solution est que vous devez cliquer sur une icône pour indiquer au moteur de reconnaissance vocale (ASR) pour commencer l'écoute et vos utilisateurs sont limités à une version spécifique de Chrome. La façon dont la plupart de ces travaux solutions est que vous devez cliquer sur l'icône pour obtenir l'énoncé suivant de l'utilisateur. Donc, une fois que l'ASR dispose d'une commande, il vous reconnaît devez cliquer sur l'icône à nouveau pour lui dire d'écouter à nouveau. Pour une application qui a un jeu de commandes très limitée ( « suivant » et « retour ») il n'y a pas beaucoup de valeur dans ce car il serait tout aussi facile pour l'utilisateur de cliquer sur un bouton qui indique à l'application d'aller de l'avant ou retour.

Il ressemble à l'API IMAO vous permet de lancer le processus de reconnaissance qui est un programme meilleure alternative. Ceci est une API JavaScript que vous avez juste à inclure dans vos pages Web pour commencer à écouter pour les entrées utilisateur. La documentation pour cette API fournit de bons exemples sur la façon de développer une application de reconnaissance vocale multimodale. Vous devrez apprendre à développer des grammaires qui spécifient le moteur de reconnaissance vocale que votre énoncés recherchez dans votre application. IMAO utilise le JSpeech Grammaire Format . Une fois que vous obtenez une reconnaissance des deux « suivant » ou « retour » de l'ASR vous simplement passer à la diapositive suivante ou précédente en utilisant JavaScript.

Autres conseils

J'utiliser l'API SpeechRecognition dans le navigateur.

Pour un moyen facile de le faire avec JavaScript, consultez annyang , qui est une bibliothèque rend très facile face à la reconnaissance vocale.

Vous pouvez essayer SpeechAPI construit avec flash et sphinx4 http://cmusphinx.sourceforge.net et qui vous permet de reconnaître de javascript browswer. Vous pouvez trouver les démos et les choses ici:

http://speechapi.com/

Vous pouvez installer votre propre serveur de reconnaissance vocale au travail avec flash en utilisant le serveur de projet discours api sourceforge

http://sourceforge.net/projects/speechcloud/

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow