¿Existe una API para la tecnología de reconocimiento de voz de Google?[cerrado]
-
27-10-2019 - |
Pregunta
Quiero intentar crear una presentación de diapositivas jQuery usando comandos de voz simples como "siguiente" o "anterior".¿Existe alguna forma de utilizar el reconocimiento de voz de Google?Conozco el x-webkit-speech de Chrome, pero tengo que hacer clic en un botón para usarlo.
Probé WAMI del MIT, pero lo encontré más lento y menos preciso que la cognición del habla de Google.
Solución
A partir de hoy, esto ya existe para Chrome: http://chrome.blogspot.co.uk / 2013/01 / hello-browser.html
( api doc )
Otros consejos
Para obtener una forma sencilla de hacer esto con JavaScript, consulte annyang , que es una biblioteca que facilita el manejo del reconocimiento de vozsuperfácil.
El problema es qué capturará el habla de su usuario y le enviará algún servidor de voz para su procesamiento.x-webkit-speech está integrado en el navegador y el navegador utiliza la tarjeta de sonido de la PC para capturar el habla.Javascript / Jquery en un navegador por sí solo no puede acceder a los dispositivos de hardware.No sé si Chrome expone algún objeto x-webkit-speech en el DOM para que pueda capturarlo a través de Javascript.
Dicho esto, la gente ha realizado ingeniería inversa de la API de voz de Google y la ha utilizado a partir del código.Consulte http://mikepultz.com/2011/03/accessing.-google-speech-api-chrome-11 / como ejemplo.
Encontré esto, no lo he usado personalmente, no sé si es completamente lo que estás buscando, pero échale un vistazo.
http://captico.com/introducing-speech-2-text-api-by-google / 2011/03