سؤال

أنا أستخدم Tesseract في أحد تطبيقاتي ، وأواجه مشكلة في الحصول على نتائج مثالية. عندما أستخدم المكتبة على لقطة شاشة مثالية ، فإنها تحصل على معظم النص وهذا جيد. ولكن عندما أستخدمها على صورة على سبيل المثال ، فإنه يواجه مشكلة في العمل ، وأحيانًا لن يعيد أي شيء.

أعلم أنه يمكنك تدريب Tesseract ، هل هناك برنامج تعليمي جيد للتدريب أو شيء من أجل التعرف على صور iPhone؟ أم أن هناك أي تعديلات يجب أن أجريها على صورة المصدر قبل معالجتها؟

شكرًا!

هل كانت مفيدة؟

المحلول

انشر عينة الموافقة المسبقة عن علم. إليك بعض الأشياء التي يجب النظر إليها:

كيف تحصل على الصورة إلى 1 بت؟ في نهاية المطاف ، تتم OCR في صور B/W - ربما يمكنك القيام بعمل أفضل من المكتبة.

ما هو DPI من الصورة؟ عادة ما تكون عمليات المسح حوالي 200-300 نقطة في البوصة ، ولكن يمكن أن تكون الصور 72 أو 96. تنظر محركات التعرف الضوئي على DPI للتعرف على حجم الحروف. قد تحتاج إلى تغيير DPI وإعادة تغيير (تغيير حجم) الصورة بحيث يطابق DPI التوقعات. تتوقع محركات OCR المستندات الممسوحة ضوئيًا ، وليس الصور الفوتوغرافية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top