سؤال

أحاول أداء التعرف على نص ألماني مع محرف Fraktur مع OCropus، لكن يبدو أنه يستخدم حزمة DEU-F.

فيما يلي الخطوات التي قمت بها.

  1. جمع وتثبيت tesseract والأونروبوس.
  2. تحميلها http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gz., ، تفصيلها إلى Tessdata /.

ولكن عندما اتصل

 $ ocroscript recognize --tessLanguage=deu-f --output-mode=text image.png

النتائج هي نفسها كما عندما اتصلت

$ ocroscript recognize --tessLanguage=eng --output-mode=text image.png

أي أفكار ما هي المشكلة؟

هل كانت مفيدة؟

المحلول

تم وصف المشكلة في http://code.google.com/p/ocropus/issues/detail؟id=87.. وبعد فقط تحتاج إلى تطبيق التصحيح إلى ocropus وإعادة بناءه.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top