Распознавание Fraktur с помощью OCRopus/Tesseract в Linux
Вопрос
Я пытаюсь выполнить распознавание немецкого текста с помощью шрифта Fraktur с помощью Ocropus, но, похоже, он не использует пакет deu-f.
Вот шаги, которые я выполнил.
- Скомпилировал и установил tesseract и ocropus.
- Скачано http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz, распаковал его в tessdata/.
Но когда я звоню
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
результаты такие же, как когда я звоню
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
Есть идеи, в чем проблема?
Решение
Проблема описана в http://code.google.com/p/ocropus/issues/detail?id=87.Просто нужно применить патч к ocropus и пересобрать его.
Не связан с StackOverflow