tesseract أو أي ocr lib آخر

https://stackoverflow.com/questions/4314060

29-09-2019
|

سؤال

أبحث عن شرح / doc / api doc / أمثلة على كيفية استخدام (والتدريب؟) tesseract في C ++ ، لا شيء مفيد على صفحة Google Tesseract ، ومع ذلك للعثور على شيء عبر الويب.

أي شخص مفيد ، ستكون التجارب أكثر من موضع ترحيب ، حيث ليس لدي أي فكرة عن كيفية البدء بها.

ملاحظة:

أنا منفتح للحصول على اقتراحات بشأن المكتبات الأخرى.
فقط مجانا المكتبات

المحلول

لديّ بعض الخبرة مع Tesseract ... تكشف Google بسيطة من "التدريب Tesseract" عن هذه الصفحة:http://code.google.com/p/tesseract-ocr/wiki/trainingtesseractحيث يجب عليك اختيار إصدار Tesseract الذي ترغب في تدريبه .. في حين أن 3 هو أحدث إصدار ، فهو جديد تمامًا ، وبالتالي لا يزال الأشخاص يقومون بترك أي مشكلات - ما زلت أستخدم الإصدار 2.4. على أي حال ، سترى أن هناك حوالي 9 خطوات في تدريب Tesseract على "لغة" معينة (أو ما كان ينبغي أن يسمى "الخطوط" أو "مجموعات الأحرف"). يمكنك أيضًا استخدام لغة "المهندس" الحالية - لكن ذلك يعتمد على تطبيقك. على سبيل المثال ، في طلبي ، سيتعين علي إجراء تحليل المستند وأخذ منطقة معينة وأرغب في التعرف على سلسلة من الأرقام المكونة من 13 حرفًا - وكنت بحاجة إلى دقة عالية - ولم أكن أرغب في قراءة "5". S 'و "0" كـ "O" إلخ ، لذلك كان من المنطقي إنشاء "لغة" معينة لمجموعة خطتي الخاصة التي تتكون فقط من الأحرف 0..9 ، في حين أنك قد لا تهتم إذا حصلت على ضوضاء إضافية

نصائح أخرى

Tesseract OCR هي مكتبة مفتوحة المصدر لاكتشاف الطابع البصري. تحتاج فقط إلى تضمين ملفات المكتبة إذا كنت تستخدم Visual Studio. إذا كنت تستخدم QT Creator ، فعليك إنشاء المكتبة للعمل على QT. تحتاج إلى استخدام cmakelist أو cmake واجهة المستخدم الرسومية لبناء المكتبة. يمكنك زيارة الرابطOpenCV OCR Build for QT 5.4 Mingw

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow