Fraktur الاعتراف مع ocropus / tesseract على لينكس
سؤال
أحاول أداء التعرف على نص ألماني مع محرف Fraktur مع OCropus، لكن يبدو أنه يستخدم حزمة DEU-F.
فيما يلي الخطوات التي قمت بها.
- جمع وتثبيت tesseract والأونروبوس.
- تحميلها http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz., ، تفصيلها إلى Tessdata /.
ولكن عندما اتصل
$ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png
النتائج هي نفسها كما عندما اتصلت
$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png
أي أفكار ما هي المشكلة؟
المحلول
تم وصف المشكلة في http://code.google.com/p/ocropus/issues/detail؟id=87.. وبعد فقط تحتاج إلى تطبيق التصحيح إلى ocropus وإعادة بناءه.
لا تنتمي إلى StackOverflow