Получение транскрипции файла WAV для работы с Sphinx4
-
19-09-2019 - |
Вопрос
у меня есть SPHINX-4 Установлено на моей системе Windows XP и настройке JSAPI. Я хотел бы транскрибировать английский файл разговора (или mp3) в текст.
Когда я запускаю «Wavfile» демонстрация - он работает успешно.
java -jar WavFile.jar
Но когда я так передаю свой собственный файл wav:
java -jar WavFile.jar c:\test.wav
Я получил:
Распознавание загрузки, как определено в 'jar: file:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/config.xml' ...
Декодирование банка: файл:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345.
Кажется, что эта демонстрация настроена для загрузки и запуска внутреннего файла WAV ("12345.wav") или что -то в этом роде.
Я прочитал документы и просто не могу понять, как настроить «config.xml» или даже какой каталог, чтобы поместить его. Я просто пытаюсь получить простое доказательство концепции, работающего с использованием стандартных демонстраций.
Итак, вопрос в том, как мне запустить программу SPHINX4 для транскрибирования файла WAV?
Спасибо.
Решение
Не уверен, что вам все еще нужен ответ. Но я думаю, что эта ссылка вы хотите (но работает только для цифровых данных):http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/readme.html
Другие советы
Что нужно, так это написать новое приложение (на основе Transcriber.java), которое использует словарь CMU (американский английский) вместо чисел, которые поддерживает Transcriber.jar.
Странно, что Sphinx не поставляется с таким полезным образцом.
Я знаю, что это супер старая ветка, но я просто хотел отметить, что ваш пример, похоже, работал идеально. Если вы посмотрите на самый конец своего вывода:
Декодирование банка: файл:/c: /sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /Edu/cmu/sphinx/demo/wavfile/12345. ========= Результаты от декодирования wav audio!
Посмотрите на пакет PocketSphinx. Он написан в C, был составлен для каждой платформы и может использоваться в качестве командной линии или как часть приложения. Я работал с командной строкой, и она чрезвычайно универсальна.