Comment créer des commandes de discours ensemble de données

https://datascience.stackexchange.com/questions/35992

31-10-2019
|

Question

Je prévois de créer un réseau de reconnaissance vocale qui reconnaît quelques mots (commandes vocales) et est tombé sur Ensemble de données de discours De Google. Outre le jeu de données disponible, je prévois d'ajouter quelques mots supplémentaires comme "déplacer", "sauver", etc., qui ne font pas partie de l'ensemble de données de Google.

Existe-t-il un moyen ou une autre source où je peux créer / trouver l'ensemble de données pour les mots?

Comme bon nombre de l'ensemble de données en ligne sont disponibles pour les phrases et les transcriptions de la parole, je pense à écrire des scripts qui peuvent passer par les transcriptions disponibles et trouver l'emplacement du mot souhaité et en recadrant physiquement l'audio, puis en le rembourrant pour faire un deuxième fichier audio . Mais cela semble très très ardu et peu de mots comme le nom de mon robot ne seront pas disponibles en ligne.

Pouvez-vous suggérer un moyen?

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange