Question

J'ai une tâche PROGRAMMATION (devoirs) pour enquêter sur les méthodes de réseau neuronal force brute. Cette partie du problème est MY devoirs.

Nous devons montrer que certains mots simples répétées dans une conversion verbale pourrait être en mesure d'être reconnu comme similaire. Nous n'avons pas à l'entraînement ce que le mot est juste qu'il est une répétition possible. Pour limiter mon « espace de recherche » Je veux briser le fichier WAV en fragments. Pour éviter les « Donald Knuth » syndrome Je ne veux pas détourner les énergies dans RMS d'apprentissage, l'analyse de Fourier pour établir le profil de fréquence etc.

Je suis à la recherche d'une fenêtre à base util pour diviser des fichiers wav. Je l'ai regardé un appelé GramoFile.exe . Il fonctionne bien au niveau de la chanson LP de briser les enregistrements de plateau en vinyle, mais pas les petits fragments de parole. Il est un util Linux avec une version DOS. Elle est limitée à diviser en 99 uniquement les fichiers. J'ai essayé de diviser 99 fragments puis exécuter la première, deuxième, etc fichiers séparés par le GramoFile.exe, mais pas de chance. Il ne peut pas traiter les pauses volonté infinitésimales entre les mots.

Toutes les suggestions?

Était-ce utile?

Autres conseils

wav est assez simple.

Voici un extrait de code c # je l'ai écrit à lire plus tôt dans un wav en deux tableaux (gauche, canal droit). Une fois que vous avez là, vous pouvez le diviser comme bon vous semble. Il ne devrait pas être difficile de port langue de votre choix.

amplitude moyenne d'un .wav en C #

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top