Pergunta

eu tenho Esfinge-4 Instalado no meu sistema Windows XP e JSAPI configurado. Eu gostaria de transcrever um arquivo WAV falado em inglês (ou mp3) para texto.

Quando eu corro o Demoção "Wavfile" - Ele é executado com sucesso.

java -jar WavFile.jar

Mas, quando passo meu próprio arquivo WAV como este:

java -jar WavFile.jar c:\test.wav

Eu recebo:

Reconhecimento de carregamento conforme definido em 'jar: arquivo:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/config.xml' ...

Jar de decodificação: Arquivo:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav: um resultado: um três três três três cinco cinco três três

Parece que essa demonstração está configurada para carregar e executar um arquivo WAV interno ("12345.wav") ou algo assim.

Eu li os documentos e simplesmente não consigo descobrir como configurar o "config.xml" ou mesmo em que diretório o colocou. Estou apenas tentando obter uma prova simples de conceito usando as demos padrão.

Então, a pergunta é: como faço para executar um programa SPHINX4 para transcrever um arquivo WAV?

Obrigado.

Foi útil?

Solução

Não tenho certeza se você ainda precisa da resposta. Mas acho que esse link é o que você deseja (mas só funciona para dados digitais):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriter/readme.html

Outras dicas

O que é necessário é escrever um novo aplicativo (baseado no transcriter.java) que usa o dicionário CMU (inglês americano) em vez dos números que o transcriter.jar suporta.

É estranho que a esfinge não venha com uma amostra tão útil.

Sei que este é um tópico super antigo, mas eu só queria ressaltar que seu exemplo parece ter corado perfeitamente. Se você olhar para o final da sua saída:

Jar de decodificação: arquivo:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.wav: um resultado: um três três três três cinco <= ========= Resultados do áudio WAV Decoding!

Veja o pacote PocketSphinx. Está escrito em C, foi compilado para todas as plataformas e pode ser usado como uma linha de comando ou como parte de um aplicativo. Eu tenho trabalhado na linha de comando com ela e é extraordinariamente versátil.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top