Вопрос

у меня есть SPHINX-4 Установлено на моей системе Windows XP и настройке JSAPI. Я хотел бы транскрибировать английский файл разговора (или mp3) в текст.

Когда я запускаю «Wavfile» демонстрация - он работает успешно.

java -jar WavFile.jar

Но когда я так передаю свой собственный файл wav:

java -jar WavFile.jar c:\test.wav

Я получил:

Распознавание загрузки, как определено в 'jar: file:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/config.xml' ...

Декодирование банка: файл:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.

Кажется, что эта демонстрация настроена для загрузки и запуска внутреннего файла WAV ("12345.wav") или что -то в этом роде.

Я прочитал документы и просто не могу понять, как настроить «config.xml» или даже какой каталог, чтобы поместить его. Я просто пытаюсь получить простое доказательство концепции, работающего с использованием стандартных демонстраций.

Итак, вопрос в том, как мне запустить программу SPHINX4 для транскрибирования файла WAV?

Спасибо.

Это было полезно?

Решение

Не уверен, что вам все еще нужен ответ. Но я думаю, что эта ссылка вы хотите (но работает только для цифровых данных):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/readme.html

Другие советы

Что нужно, так это написать новое приложение (на основе Transcriber.java), которое использует словарь CMU (американский английский) вместо чисел, которые поддерживает Transcriber.jar.

Странно, что Sphinx не поставляется с таким полезным образцом.

Я знаю, что это супер старая ветка, но я просто хотел отметить, что ваш пример, похоже, работал идеально. Если вы посмотрите на самый конец своего вывода:

Декодирование банка: файл:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345. ========= Результаты от декодирования wav audio!

Посмотрите на пакет PocketSphinx. Он написан в C, был составлен для каждой платформы и может использоваться в качестве командной линии или как часть приложения. Я работал с командной строкой, и она чрезвычайно универсальна.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top