Come posso convertire il parlato in testo?

https://stackoverflow.com/questions/491578

20-08-2019
|

Domanda

Come posso prendere MP3 e convertire il discorso in testo?

Ho alcune note registrate da una conferenza e dalle riunioni (c'è una sola voce nella registrazione, che è la mia voce). Ho pensato che sarebbe stato più facile e intellettualmente interessante convertirsi in testo usando gli strumenti di sintesi vocale anziché trascriverli semplicemente a mano. So che ci sono tecnologie là fuori, specialmente per le applicazioni VoIP che usano Asterisk e Podcast, ma cosa sono e come posso usarle?

Soluzione

Open Source: Sfinge CMU

Shareware: http://www.e-speaking.com/ (Windows)

Commerciale: Dragon NaturallySpeaking (Windows)

Altri suggerimenti

.NET può farlo con il suo spazio dei nomi System.Speech.

Dovresti prima convertirlo in .wav o catturare l'audio dal vivo dal microfono.

I dettagli sull'implementazione sono disponibili qui: Trascrizione dell'audio con .NET

Dragon NaturallySpeaking sembra supportare l'ingresso MP3.

Se vuoi una versione open source (penso che ci siano alcuni progetti di integrazione di Asterisk basato su questo).

In ritardo alla festa, quindi rispondi di più per riferimento futuro.

I progressi nel campo + la mentalità e l'agenda di Mozilla hanno portato a questi due progetti a tal fine:

Quest'ultimo ha un set di dati da 12 GB per il download. Il primo consente di addestrare un modello con i tuoi file audio a mia comprensione

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow