Audio et la synchronisation du texte. Y at-il une bibliothèque PNL / speech-to-text de le faire?
-
28-09-2019 - |
Question
Je voudrais synchroniser un enregistrement oral contre un texte connu. Y at-il un discours à texte / bibliothèque de traitement du langage naturel qui faciliterait cela? J'imagine que je veux détecter les limites des mots et compute matchs candidats d'un dictionnaire. La plupart des questions que j'ai trouvé sur le souci SO langage écrit.
désiré, mais pas obligatoire:
- Open Source
- Compatible avec l'anglais américain out-of-the-box
- multi-plateforme
- Bien documenté
Modifier. Je sais que cela est très large, même naïve, question, donc merci à l'avance pour vos conseils
Ce que j'ai trouvé à ce jour:
- OpenEars (wrapper iOS Sphinx / Flite)
La solution
Alignement forcé
On dirait que vous voulez faire forcé l'alignement entre votre audio et le texte connu.
Quasiment tous les systèmes de reconnaissance vocale de qualité recherche / industrie sera en mesure de le faire, car l'alignement forcé est une partie importante de la formation d'un système de reconnaissance des données qui n'ont pas alignements de niveau de téléphone entre l'audio et la transcription.
Alignement CMUSphinx
La version bêta Sphinx4-1.0 version 5 du système de reconnaissance vocale open source CMU comprend maintenant une démonstration sur la façon de faire un alignement entre les enregistrements vocaux et transcription longue.