¿Existe una API para la tecnología de reconocimiento de voz de Google?[cerrado]

https://stackoverflow.com/questions/8830203

27-10-2019
|

Pregunta

Quiero intentar crear una presentación de diapositivas jQuery usando comandos de voz simples como "siguiente" o "anterior".¿Existe alguna forma de utilizar el reconocimiento de voz de Google?Conozco el x-webkit-speech de Chrome, pero tengo que hacer clic en un botón para usarlo.

Probé WAMI del MIT, pero lo encontré más lento y menos preciso que la cognición del habla de Google.

Solución

A partir de hoy, esto ya existe para Chrome: http://chrome.blogspot.co.uk / 2013/01 / hello-browser.html

( api doc )

Otros consejos

Para obtener una forma sencilla de hacer esto con JavaScript, consulte annyang , que es una biblioteca que facilita el manejo del reconocimiento de vozsuperfácil.

El problema es qué capturará el habla de su usuario y le enviará algún servidor de voz para su procesamiento.x-webkit-speech está integrado en el navegador y el navegador utiliza la tarjeta de sonido de la PC para capturar el habla.Javascript / Jquery en un navegador por sí solo no puede acceder a los dispositivos de hardware.No sé si Chrome expone algún objeto x-webkit-speech en el DOM para que pueda capturarlo a través de Javascript.

Dicho esto, la gente ha realizado ingeniería inversa de la API de voz de Google y la ha utilizado a partir del código.Consulte http://mikepultz.com/2011/03/accessing.-google-speech-api-chrome-11 / como ejemplo.

Encontré esto, no lo he usado personalmente, no sé si es completamente lo que estás buscando, pero échale un vistazo.

http://captico.com/introducing-speech-2-text-api-by-google / 2011/03

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow