motori di riconoscimento vocale per applicazioni embedded

https://stackoverflow.com/questions/1862533

16-09-2019
|

Domanda

Sto cercando di ricerca motori di riconoscimento vocale disponibili e SDK per lo sviluppo di un'applicazione abilitata la voce di Windows CE. Ho eseguito attraverso Nuance, ma non vedo molto di qualsiasi altra cosa. Io preferirei un Net SDK, se possibile, ma immagino la maggior parte sarebbe C / C ++. Apprezzo tutti i suggerimenti. Grazie.

Soluzione 5

Come affermato in uno dei miei commenti sopra, stiamo cercando un riconoscimento vocale Net SDK da Vangard Voice Systems. Si utilizza il motore di riconoscimento vocale di Nuance Vocon3200 che è ben rispettato e sembra funzionare bene nei test in anticipo. Stiamo utilizzando un microfono a buon mercato in questo momento e avere alcuni problemi con il rumore esterno. Si spera che verrà risolto con auricolari a cancellazione di rumore. Il modello di software è un po 'carente in quanto si aggancia in fondo in un'applicazione non vocale esistente. Vi sono alcune limitazioni dovute a questo fatto e v'è un'API limitata accessibili dallo sviluppatore. Ogni volta che si tenta di semplificare qualcosa di simile, si effettua la lavorazione una potente soluzione molto più difficile. Con questo detto, non abbiamo potuto trovare qualsiasi prodotto concorrente che serve le nostre esigenze di un Net SDK per voce abilitazione di applicazioni mobili. Attualmente hanno un bel po 'di nicchia scavata.

avrei preferito andare con C ++ di Nuance SDK (per i quali un'altra società ha scritto involucri Net), ma il modello di business Nuance assume stiamo sviluppando un prodotto per la rivendita e ha alcuni diritti significativi coinvolti. Un vero e proprio ostacolo per una società che vuole sviluppare applicazioni interne.

Altri suggerimenti

Nuance ha praticamente comprato tutti in su. Essi dominano il mercato discorso, ho paura ...

Ci sono alcune altre aziende che si occupano di tecnologia, ma non so quanto bene lo fanno nel mercato embedded. C'è telisma e Loquendo , entrambi i quali hanno forti presenze non inglesi (e il loro inglese non è troppo male).

Poi c'è ancora IBM. Hanno Embedded ViaVoice .

Una delle grandi cose che il settore è in attesa è per vedere che cosa esce dalla acquisizione di Microsoft di TellMe , ma penso che il mercato embedded che potrebbe stare lontano da invece di spingere l'elaborazione per la "nuvola", che è dove TellMe è stato per un lungo periodo di tempo.

Io lavoro con le applicazioni IVR; in aggiunta alle sfumature stiamo valutando Microsoft, IBM, e Lumenvox.

La voce applicazioni di riconoscimento inclusi sulla maggior parte dei telefoni cellulari sono progettati per abbinare input vocale a una frase precedentemente parlato, come ad esempio l'assegnazione della frase "Joe" per una voce della rubrica e avere il telefono con linea che voce della rubrica quando si dice " Joe". I più potenti motori di riconoscimento vocale cercano di decifrare il discorso a forma libera rompendo una frase giù in fonemi , e quindi la corrispondenza con un repository acustico per cercare di capire ciò che è stato effettivamente detto. Un completo motore di riconoscimento vocale soffiato richiede una buona dose di potenza della CPU; di fare qualsiasi cosa complessa con riconoscimento vocale su un dispositivo mobile, avrete probabilmente bisogno di inviare dati dal dispositivo a un server per l'elaborazione.

Prova a guardare nella Speech API di Microsoft, http://msdn.microsoft. com / it-it / library / ms897381.aspx

Credo che gira su dispositivi CE.

C'è anche il progetto open source CMU Sphinx . Hanno una variante denominata pocketsphinx che è stato preso di mira per i dispositivi portatili.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow