Распознавание Fraktur с помощью OCRopus/Tesseract в Linux

Вопрос

Я пытаюсь выполнить распознавание немецкого текста с помощью шрифта Fraktur с помощью Ocropus, но, похоже, он не использует пакет deu-f.

Вот шаги, которые я выполнил.

Скомпилировал и установил tesseract и ocropus.
Скачано http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz, распаковал его в tessdata/.

Но когда я звоню

 $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

результаты такие же, как когда я звоню

$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

Есть идеи, в чем проблема?

Решение

Проблема описана в http://code.google.com/p/ocropus/issues/detail?id=87.Просто нужно применить патч к ocropus и пересобрать его.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow