Распознавание Fraktur с помощью OCRopus/Tesseract в Linux

StackOverflow https://stackoverflow.com/questions/1867632

  •  18-09-2019
  •  | 
  •  

Вопрос

Я пытаюсь выполнить распознавание немецкого текста с помощью шрифта Fraktur с помощью Ocropus, но, похоже, он не использует пакет deu-f.

Вот шаги, которые я выполнил.

  1. Скомпилировал и установил tesseract и ocropus.
  2. Скачано http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz, распаковал его в tessdata/.

Но когда я звоню

 $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

результаты такие же, как когда я звоню

$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

Есть идеи, в чем проблема?

Это было полезно?

Решение

Проблема описана в http://code.google.com/p/ocropus/issues/detail?id=87.Просто нужно применить патч к ocropus и пересобрать его.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top