مراجعة المعرفة التعريفي ومراجعة الكلمات

StackOverflow https://stackoverflow.com/questions/2396085

  •  25-09-2019
  •  | 
  •  

سؤال

أنا أستخدم Tesseract لمشروع التعرف على الرسائل الخاص بي ، كما أن الاعترافات جيدة جدًا. تم إجراء جزء معالجة الصور باستخدام مكتبات OpenCV. يتم كتابة الحروف. ولكن هناك بعض المشكلات عندما استخدمتها للتعرف على الحرف "O" والرقم "0". يتم استخدام هذه الحروف في مناطق البيانات كحقول تدخل الأسماء. لذلك لا يمكن أن يكون للأسماء أي أرقام معها. وعندما نستخدم نظام حقول البيانات كتاريخ للولادة ، فإنه يحتوي فقط على أرقام. لذلك أنا على استعداد لتقديم قيود على نظام التعرف على أن حقول البيانات المقابلة لها أرقام أو الحروف فقط.

وأنا أيضًا على استعداد لمراجعة الرسائل المعترف بها بالكلمات المحتملة حتى نتمكن من تحسين دقة البيانات. أنا على استعداد لاستخدام مكتبات OpenCV لهذه المهمة. لكنني لا أعرف ما هي المكتبات التي تساعد في هذه المهمة وما هي وظائف هؤلاء. لذا من فضلك هل يمكن لأحد أن يساعدني. شكرًا لك.

التحيات ، ثيلانكا.

هل كانت مفيدة؟

المحلول

لم أستخدم Tesseract أبدًا. لكن، في الأسئلة الشائعة يقول

كيف يمكنني التعرف على الأرقام فقط؟

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

من المفترض أنه يمكنك استخدام نمط إدخال الأسئلة الشائعة لإعداده بحيث يتعرف فقط على الحروف أو فقط الأرقام بشكل مناسب.

إذا كنت قد جربت هذا بالفعل ، هل يمكنك إعطاء المزيد من التفاصيل عن سبب عدم عمله؟

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top