Domanda

Ho intenzione di creare una rete di riconoscimento vocale che riconosca poche parole (comandi vocali) Set di dati dei comandi vocali da Google. Oltre al set di dati disponibile, sto pianificando di aggiungere qualche altra parola come "mossa", "salva" ecc., Che non fanno parte del set di dati di Google.

C'è un modo o qualsiasi altra fonte in cui posso creare/trovare il set di dati per le parole?

Poiché molti dei set di dati online sono disponibili per frasi e trascrizioni vocali, sto pensando di scrivere uno script che può passare attraverso le trascrizioni disponibili e trovare la posizione della parola desiderata e ritagliare fisicamente l'audio e quindi imbottirlo per fare un secondo file audio . Ma questo sembra un processo molto arduo e poche parole come il nome del mio robot non saranno disponibili online.

Ragazzi, potete suggerire un modo?

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top