Linux의 Ocropus/Tesseract를 사용한 Fraktur 인식
문제
Ocropus와 함께 Fraktur 서체로 독일어 텍스트를 인정하려고 노력하고 있지만 DEU-F 패키지를 사용하지 않는 것 같습니다.
내가 수행 한 단계는 다음과 같습니다.
- Tesseract 및 Ocropus를 컴파일하고 설치했습니다.
- 다운로드 http://tesseract-ocroc.googlecode.com/files/tesseract-2.01.deu-f.tar.gz, Tessdata/에 포장을 풀었습니다.
하지만 내가 전화 할 때
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
결과는 내가 전화 할 때와 동일합니다
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
문제가 무엇인지 아이디어가 있습니까?
해결책
문제는 다음에 설명되어 있습니다 http://code.google.com/p/ocropus/issues/detail?id=87. 패치를 Ocropus에 적용하고 재건하면됩니다.
제휴하지 않습니다 StackOverflow