سؤال

انا استخدم tesseract ocr. (عبر Pytesser.) و pil (مكتبة الصور بيثون) للاختبار الآلي للتطبيق.

أنا أتحقق من أن النص المعروض لا بأس به عن طريق صنع لقطة شاشة والحصول على النص بفضل tesseract.

كان لدي بعض المشكلات في البداية، ويبدو أنه يعمل بشكل أفضل منذ زادت حجم لقطة الشاشة بفضل الاستيفاء المبرمجي من PIL.

لسوء الحظ، لا يزال لدي بعض الأخطاء مثل الارتباك بين "0" و "O". أستطيع أن أتخيل أنني سوف يكون لدي مشاكل أخرى مماثلة في المستقبل.

أود أن أعرف ما إذا كان هناك بعض التقنيات لإعداد صورة لمساعدة التعرف الضوئي على الحروف. ورحب أي فكرة.

شكرا لك مقدما

هل كانت مفيدة؟

المحلول

قابس وقح و إخلاء المسئولية: شركتي حزم TESSERACT للاستخدام في .NET

Tesseract هو محرك موافق OCR. يمكن أن تفوت الكثير ويصبح مرتبكا بسهولة من خلال عدم النص. أفضل شيء يمكنك القيام به لأنه هو التأكد من أنه يحصل على نص فقط. أفضل ما هو أفضل شيء هو إعطائه شيئا يائني (عتبة تكيفية أو ديناميكية للوصول إلى هناك) أو تدرج الرمادي واتركها محاولة القيام براتب.

نصائح أخرى

  1. تدريب tesseract للتعرف على الخط الخاص بك
  2. جعل الصورة نظيفة للغاية ومع مساحة حرة كافية حول الأحرف
  3. ربح :)

هنا عدد قليل من أمثلة العالم الحقيقي.

  • الصورة الأولى هي الصورة الأصلية (أرقام عداد الطاقة المحاصيل)
  • الصورة الثانية تنظيف الصورة قليلا في GIMP، حوالي 50٪ من دقة الوصول عبر الإنترنت في TESSERACT
  • الصورة الثالثة يتم تنظيفها تماما صورة - 100٪ UCR المعترف بها دون أي تدريب!

enter image description here enter image description here enter image description here

حتى في ظل أفضل الظروف، سوف تتسلل المتغيرات OCR عليك. سيكون خيارك الأفضل لتصميم اختباراتك لتكون على علم بها.

للتمييز بين 0 و O، أحد الحلول البسيطة هو اختيار خط يميز بين الاثنين (على سبيل المثال: 0 لديه اندفاعة أو نقطة في منتصفها). هل سيكون ذلك مقبولا في طلبك؟

حل آخر هو تطبيق خطوة قائمة على القاموس بعد تحليل الأحرف على الطابع للنص - إطعام النص المعترف به في شكل من أشكال التدقيق الإملائي أو المصدق للتمييز بين الأحرف الصعبة.

على سبيل المثال، من المرجح أن يكون رمز جولة متبوعا بأرقام أخرى صفرية، في حين أن نفس الرمز الذي تليه الحروف من المرجح أن يكون رأس مال. إنه مثال تافه، لكنه يوضح كيف هو سياق ضروري لجعل نظام التعرف الضوئي عبر الإنترنت أكثر موثوقية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top