OCR: كيفية مقارنة الصور، وفرز غير مرغوب فيها والقيام بذلك بسرعة؟

https://stackoverflow.com/questions/574923

05-09-2019
|

سؤال

تمكنت من تخزين كل حرف في صورة نقطية وأبحث عن وسيلة لتحديد الشخصية التي هي بسرعة.

لذلك أنا على وشك تخزين كل شخصية ممكنة في صفيف من 1 و 0، ومقارنتها بمجموعة من الصورة النقطية التي أمسك بها للتو.

يمكنني أن أفعل الشيكات البسيطة مثل مقارنة عدد البكسل الأسود الذي حصلت عليه، ومقارنة الأبعاد وهلم جرا، ولكن كل هذه الشيكات بطيئة (مجرد تخمين ..).

إذن ما أبحث عنه هو الأسلوب، الذي يذهب من خلال كل بكسل من أسفل إلى أعلى، أو عشوائيا الذي يقارن مجموعة إلى مجموعة من الصفائف وفرز لا يظل خارج، حتى يبقى صفيف واحد فقط. ولكن كيف يمكنني تنفيذ ذلك؟

شكرا لمساعدتك.

سفين

المحلول

في World OCR، نادرا ما تديره إلى "مباراة مثالية" بين TargetResource وموردك الأصلي.

في الواقع إنه مجال ضخم من العلوم، ولكن إليك أطروحة لطيفة حول هذا الموضوع والتي يجب أن تعطيك بعض المعرفة الأساسية:http://www.discover.uottawa.ca/~qchen/my_papers/master_thesis.pdf.

لاحظ أن الخوارزميات مثل هذه الرياضيات ثقيلة للغاية وفي الوقت الحالي محسنة ل CPU X86 القياسية.

إذا كنت تبحث عن تطابق مثالي (أعني، فأنت مثالي حقا، إلى بايت إلى بايت) وتريد تنفيذ هذا سريع وسهل، أود أن أقترح القيام بعمل "تخطي عدم التطابق الواضح سريع" - خوارزمية - شيء مثل:

1) مقارنة حجم الصفائف، إذا كان مختلفا، فهذا ليس ما تبحث عنه

2) قارن قيمة تجزئة لكل الصور النقطية

3) قارن كل بت / بايت واحد من قبل واحد وبمجرد أن ترى فرقا، ليس ما تبحث عنه

4) الفوز، وجدت تطابق :)

هذا بطيء جدا، اعتمادا على ما تحاول تحقيقه، ولكن من السهل التنفيذ وسيعمل. حتى تسير الأمور على ما يرام لتطبيق النموذج الأولي. كما قلت، تعد OCR (وجميع الأشكال الأخرى من معالجة الإشارات الرقمية) مجالا كبيرا من البحث، لذلك ليس شيئا ما يمكنك أن تتوقع أن يعلمك الناس في forumpost سريعة، للأسف :(

حظ سعيد

تحرير] النظر في التعليق في OQ الخاص بك، سأقول الذهاب للحصول على دراس بيانات Hashtable / القاموس سيكون الأسرع بالنسبة لك. أن، أو شجرة البحث الثنائية .. كل من الاعتماد جدا onj مولد مفتاح التجزئة الخاص بك :)

EDID2 (XD)] "نص مستعشير الناتج عن جهاز كمبيوتر. الخلفية مختلفة، ولكن النص لديه دائما نفس اللون." معلومات مهمة للغاية هناك: ص هي حجم النص / الصور النقطية نفسها أيضا كذلك؟ أقترح إما أن تنفذ خوارزمية التجزئة الخاصة بك حيث تتجاهل ألوان الخلفية مسبقا، بحيث تعتمد قيمة التجزئة فقط على لون النص (وشكل هذا أيضا OFC) أو ببساطة إعادة كتابة جميع بكسل الخلفية في أهدافك أن تكون نفس اللون مثل الأصل (أو مجرد تعيين الخلفية الأصلية إلى أهدافك؟ يعتمد مرة أخرى على البيانات التي تقاتلها هنا - تحتاج إلى مزيد من المعلومات :)).

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow