سؤال

هل لدى أي شخص أي تجربة مع مختلف الخطوط OCR ؟ أنا توليد هوية ثم يحاول مسح مع "التراسوركت".في هذه اللحظة أنا فقط T&E'n مختلف الخطوط, ولكن هذا يبدو غير فعالة جدا.لقد حاولت التعرف الضوئي على الحروف* عائلة الخطوط وغيرها من مختلف مثل Arial وجورجيا."التراسوركت" يميل إلى الحصول على الخلط مع OCR* الخطوط.

هل هناك أي خط مصممة خصيصا tesseract ، أو أي نظام الخط الذي يعمل بشكل جيد مع ذلك ؟

هل كانت مفيدة؟

المحلول

حسنا، والبحث في جوجل يأتي مع هذا، وهو الخط OCR محدد: OCR الخط

ويبدو انها المعيار المعتمد في عام 1973.

نصائح أخرى

بعد تجربة الكثير من خطوط مختلفة ، محركات OCR كنت تميل إلى الحصول على أفضل النتائج باستخدام Consolas.وهو أحادي المسافة محرف مثل OCR-A, ولكن أسهل للقراءة بالنسبة للبشر.Consolas يتم تضمينها في العديد من منتجات Microsoft.

هناك أيضا مفتوحة المصدر الخط Inconsolata, الذي هو تتأثر Consolas.Inconsolata هو بديل جيد بالنسبة Consolas ، وخاصة بالنظر إلى الترخيص التفاصيل.

في بلدي التجارب ، أرقام المساحات في Calibri الخط لا يتم دائما الاعتراف بشكل صحيح.OCR-A أعطى الكثير من أخطاء القراءة.لم تعطي ميرك محاولة, لأنه لا يمكن قراءتها بسهولة على معظم البشر.

ملاحظة:tesseract يتطلب الكثير من التجارب وصقل قبل أن تكون موثوق بها.في حالتنا نحن تحولت إلى تجارية مرخصة محرك OCR (ABBYY) ، وخاصة منذ موثوقية كان مهم جدا ونحن بحاجة إلى دعم متعددة (الأوروبية) لغات.

تحديث: 2017 Jan 31 - تغيير 'على أساس Consolas'إلى 'تتأثر Consolas'بسبب قضايا حق المؤلف المحتملة.

وأجد أن Calibri يعمل أفضل بالنسبة لي. ونحن نستخدم برامج OCR يوميا في النظام الآلي وبعد اختبار العشرات من الخطوط (بما في ذلك بعض منها محددة OCR) أن Calibri هو دائما الأفضل.

وحظا سعيدا.

وكنت على الارجح استخدام نفس الخط الذي تستخدمه البنوك لأرقام التوجيه في الجزء السفلي من الشيكات:

http://morovia.com/font/micr.asp

وصمم خصيصا ليكون بشكل لا لبس فيه، المقروءة آليا.

وكان دائما النجاح ببساطة عن طريق استخدام تايمز الرومانية الجديدة ..

ولقد تم القيام اختبارات مكثفة في هذا مؤخرا في ECM من Laserfiche يسمى، والذي يستخدم فارق بسيط OMNIPAGE، ولقد وجدت أن الخطوط أحادي المسافة يؤدون مقارنة سيئة للمتباعدة الخطوط بشكل حيوي. تلك الخطوط OCR القديمة لا يؤدون وكذلك المزيد من الخطوط تبحث "عادية". خاصة بالنسبة للسلاسل من الأرقام في أحجام الخطوط الصغيرة مثل النقطة 12.

ومن الغريب أن شخصا آخر هو وجود النجاح مع Calibri. ومن ضعيفا جدا في بلدي التجارب، والحصول بشكل روتيني رسائل متشابهة وأرقام الخلط لبعضها البعض. وكانت أفضل الخطوط (من بين تلك التي تأتي على جهاز كمبيوتر ويندوز مع تثبيت Office) Consolas، فيردانا، وكتاب التحف. جميع الخطوط الرقيق ديناميكية حيث بدت الحروف والأرقام واضحة. كان Consolas بطل.

وتستخدم حاليا أحادي المسافة. حاول عدد كبير جدا من الخطوط، ولكن هذا هو واحد أكثر دقة بالنسبة لي.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top