OCR: كيفية تحسين الدقة - المكتبات الموجودة لإزالة "الأثاث" غير النص، الأشكال، إلخ لتجنب الخلط بين OCR؟

StackOverflow https://stackoverflow.com/questions/2448106

سؤال

أريد إزالة المستطيلات وغيرها التي أرفق النص في صورة لقطة شاشة، بحيث يمكنني إجراء التعرف على الأحرف البصرية للحصول على نص دقيق من لقطة الشاشة.

خلفية:

أقوم بذلك لاستخراج البيانات من تطبيق إرث للاستخدام مع التطبيقات الأخرى. هذه هي الطريقة الوحيدة للحصول على هذه البيانات كملفات مرتبطة بتنسيق مغلق وجهاز ثنائي مغلق.

سوف أستخدم AutoStcript لدفع التطبيق لإظهار البيانات في واجهة المستخدم الخاصة به، ثم سأقطع شحن هذا وإطعام هذا إلى TESSERACT.

لقد حصلت بالفعل بعض النجاح في أتمتة واجهة المستخدم، وقد تمكنت من استخدام TESSERACT للحصول على نص ASCII العادي من الصورة النقطية.

هناك العديد من مقالات منتدى AutoAsscriptr التي تناقش استخدامها مع TESSERACT / OCR ولكن ليس على وجه التحديد على سؤالي.http://www.autoitscript.com/forum/index.php؟s=6c32c9912756E635A619CDF175eff9&showforum=2.

ما أحتاج لفعله

هناك مستطيلات واسعة رقيقة، 1 بكسل أرفقت عن كثب بعض النصوص، عند تغذية TESSERACT، يراها كما أنا على سبيل المثال لخط الفجع من المستطيل.

أي أفكار حول كيفية إزالة المستطيلات، أو أفضل الممارسات؟

أنا أسأل عما إذا كانت هناك مجموعة أدوات قائمة على خط الأوامر Generic الكتابة فوق المستطيلات، على سبيل المثال، في ملفات .png. يمكنني بعد ذلك تمرير .png من خلال هذا، ثم اجتيازها إلى tesseract.

تفاصيل عن إصدار / إعداد Tesseract الذي استخدمته كما يلي:

اذهب الى هنا: http://code.google.com/p/tesseract-ocr/downloads/list.- للحصول على الأحرف العامة الإنجليزية الأساسية التي تم تعيينها للحصول على TESSERACT UP وتشغيلها والتعرف على نص Bitmpapped الخاص بك في نص ASCII، استخدم Tesseract-2.00.Eng.tar.gz (الإصدار الحالي في وقت الكتابة هو: "بيانات اللغة الإنجليزية ل TESSERACT (2.00 وأعلى) يوليو 2007 989 KB 84845 ")

أسئلة ذات صلة نظرت بالفعل في تجاوز كومة

في هذه، لا يتم الإجابة عن سؤالي بالكامل أو يتم بيع حل تجاري. لا أريد أن أفكر في حل تجاري في هذه المرحلة.

هل كانت مفيدة؟

المحلول

ربما لن يكون هناك حية من محلول الرف لهذا الغرض، لكن الترميز الخاص بك لا ينبغي أن يكون صعبا للغاية لأنه ربما يكون من الآمن افتراض أن المستطيل لن يكون حرفا صالحا في الأبجدية الخطية ويمكن إزالته بأمان وبعد كما أنه يساعد على أن جميع حدودك المستطيلة هي بالضبط بيكسل واحد.

لذلك ابحث عن خط أفقي متجاور يتم ربطه إلى خط مواز آخر من نفس الطول من قبل خطين عموديين بالضبط. كرر البحث حتى تجد كل المستطيلات في الصورة ثم تجعلهم جميعا شفافة الرسومات و الأقلام. وبعد لا تجعل مستطيلا شفافا حتى تنتهي من البحث آخر تخاطر بمسح أجزاء من المستطيلات المتداخلة قبل أن تجدها. هذا مجرد اقتراح بداية، لم أقوم بتنفيذ هذه الخوارزمية أو تصحيحها.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top