문제

나는 가지고있다 스핑크스 -4 내 Windows XP 시스템 및 JSAPI 설정에 설치되었습니다. 영어 음성 웨이브 (또는 MP3) 파일을 텍스트로 전사하고 싶습니다.

내가 실행할 때 "Wavfile"데모 - 성공적으로 실행됩니다.

java -jar WavFile.jar

그러나, 내가 다음과 같이 내 자신의 wav 파일을 전달할 때 :

java -jar WavFile.jar c:\test.wav

나는 얻다:

'jar :/c :/c :/c :/c :/c :/c :/c :/c :/c :/c :/c :/c :/cmu/sphinx/demo/wavfile/config.xml'...

용기 디코딩 항아리 : 파일 :/c :/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /edu/cmu/sphinx/demo/wavfile/12345.wav 결과 :

이 데모는 내부 WAV 파일 ( "12345.wav") 등을로드하고 실행하도록 설정 한 것 같습니다.

나는 문서를 읽었고 "config.xml"을 설정하는 방법 또는 심지어 그것을 배치 할 디렉토리를 설정하는 방법을 알 수 없습니다. 표준 데모를 사용하여 실행하는 간단한 개념 증명을 얻으려고 노력하고 있습니다.

따라서 문제는 다음과 같습니다. wav 파일을 전사하기 위해 Sphinx4 프로그램을 어떻게 실행합니까?

감사.

도움이 되었습니까?

해결책

여전히 답이 필요한지 확실하지 않습니다. 그러나 나는이 링크가 당신이 원하는 것이라고 생각하지만 (디지털 데이터에만 적용) :http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/readme.html

다른 팁

필요한 것은 Transcriber.jar가 지원하는 숫자 대신 CMU 사전 (American English)을 사용하는 새로운 응용 프로그램 (Transcriper.java 기반)을 작성하는 것입니다.

Sphinx가 그러한 유용한 샘플과 함께 제공되지 않는 것은 매우 이상합니다.

나는 이것이 매우 오래된 스레드라는 것을 알고 있지만, 나는 당신의 예가 완벽하게 달린 것처럼 보인다는 것을 지적하고 싶었습니다. 출력의 끝을 보면 :

항아리 디코딩 항아리 :/c :/c :/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/wavfile.jar! /edu/cmu/sphinx/demo/wavfile/12345.wav 결과 : ========= WAV 오디오 디코딩 결과!

Pocketsphinx 패키지를보십시오. C로 작성되었으며 모든 플랫폼에 대해 컴파일되었으며 명령 선 또는 앱의 일부로 사용할 수 있습니다. 나는 그것과 함께 지휘 라인을 작동 시켰으며 그것은 매우 다재다능합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top