Audio et la synchronisation du texte. Y at-il une bibliothèque PNL / speech-to-text de le faire?

https://stackoverflow.com/questions/4072020

28-09-2019
|

Question

Je voudrais synchroniser un enregistrement oral contre un texte connu. Y at-il un discours à texte / bibliothèque de traitement du langage naturel qui faciliterait cela? J'imagine que je veux détecter les limites des mots et compute matchs candidats d'un dictionnaire. La plupart des questions que j'ai trouvé sur le souci SO langage écrit.

désiré, mais pas obligatoire:

Open Source
Compatible avec l'anglais américain out-of-the-box
multi-plateforme
Bien documenté

Modifier. Je sais que cela est très large, même naïve, question, donc merci à l'avance pour vos conseils

Ce que j'ai trouvé à ce jour:

OpenEars (wrapper iOS Sphinx / Flite)

La solution

Alignement forcé

On dirait que vous voulez faire forcé l'alignement entre votre audio et le texte connu.

Quasiment tous les systèmes de reconnaissance vocale de qualité recherche / industrie sera en mesure de le faire, car l'alignement forcé est une partie importante de la formation d'un système de reconnaissance des données qui n'ont pas alignements de niveau de téléphone entre l'audio et la transcription.

Alignement CMUSphinx

La version bêta Sphinx4-1.0 version 5 du système de reconnaissance vocale open source CMU comprend maintenant une démonstration sur la façon de faire un alignement entre les enregistrements vocaux et transcription longue.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow