كيفية العثور على حقل فارغ على صورة المستند الممسوحة ضوئيا

StackOverflow https://stackoverflow.com/questions/548309

سؤال

أريد طلبي لملء حقل واحد في نموذج موجود كملف صورة بالأبيض والأسود. يبدأ النموذج دائما كنسخة ورقية نفسها، ولكن بحلول الوقت الذي يحصل فيه طلبي من مستخدمي المستخدمين، فقد تم مسحها ضوئيا أو بالفاكس أكثر من مرة. لهذا السبب، فإن الحقل الذي أحتاجه ليس في نفس المكان في كل ملف.

لا يحصل مستخدمي المستخدمون دائما على النموذج الفارغ مني، لذلك ليس لدي القدرة على طباعة علامة أو عنصر نائب يمكنني التعرف عليه لاحقا.

هناك نص على النموذج الفارغ الأصلي، ولكن لأنه ربما كان قد تم إرساله بالفاكس، لدي 200 نقطة في الدقيقة فقط. النص هو دائما كبير بما يكفي للإنسان القراءة، لكنني متشكك بشأن OCR.

لدي بعض الميزانية حتى لا أحتاج إلى حل حر ... دعنا نقول فقط 2000 دولار.

ومع ذلك، أنا أفكر

  1. احصل على حل OCR للعثور على تسمية النص في الحقل الذي أحتاجه. لا أعتقد أن لدي الموارد أو الخبرة لتراجع بلدي. أنا لست بحاجة إلى اعتراف مثالي، لأنني أعرف بالفعل ما يقوله النص. لكنني بحاجة إلى معرفة الإحداثيات X و Y. هل هناك برنامج يفعل هذا؟ أو هل البرمجة أسهل مما أعتقد؟

  2. بناء أو شراء البرنامج للتعرف على حواف النموذج. من هناك، يمكنني الحصول على الموضع النسبي للحقل الذي أحتاجه. أفكر في الخط المتقطوع، يضع برنامج الماسح الضوئي الخاص بي حول صورة مستند صغير. هل هذا allgorhm معروف أم أن هناك حل متاح؟

  3. طريقة أخرى للتعرف على الحقل الذي أحتاجه. تعطيني محاولات برنامج ملء نموذج Google مئات المباريات لنماذج الويب ونماذج PDF وما إلى ذلك. لا تفعل ما أحتاج إليه.

أنا لست من الصعب إرضاءه حول اللغة. يعمل طلبي على نظام Linux، ولكن إذا كان الحل الأفضل هو Microsoft، فربما يمكنني جعل هذا العمل.

كنت أقدر أفكارك.

هل كانت مفيدة؟

المحلول

إذا فهمت بشكل صحيح، فإن النموذج هو نفسه دائما، ولكن قد يتم نقله أو تحجيمه أو استدارة قليلا بسبب التصوير / الفاكس. في هذه الحالة، مشكلتك هي واحدة من تسجيل الصورة: ابحث عن التحول الصلب الأمثل الذي يجعل نموذج من سطخ المستخدم مع نموذج "النموذج" الخاص بك، والذي تعرف فيه موقع مجال الفائدة. بمجرد معرفة التحول، يمكنك حساب موقع الحقل في نموذج المستخدم.

هناك العديد من خوارزميات تسجيل الصور، والتي تم تطويرها عادة للتطبيقات مثل محاذاة صور السيد للدماغ. هم باهظة الثمن بشكل حسابي وتتطلب من الشاورات الإحصائية. لحسن الحظ، حالك أسهل: كل ما عليك فعله هو مناسب لمستطيل حول محتويات نموذج المستخدم. يجب أن تعمل النزول. سوف تحتاج إلى بعض التسامح للضوضاء (غير المرغوب فيه خارج النموذج).

نصائح أخرى

إليك موجز بعض القليل من حلول OCR المتاحة (المصدر المفتوح وليس): http://googlesystem.blogspot.com/2007/04/OPEN-Source-OCK-Software-Sponsored-by.html.

قد لا يكون التسجيل الصارم كافيا. قد يقوم المستخدمون بتعديل تخطيط وتنسيق نموذج القالب، مثل تغيير الخطوط، وقم بتغيير موقع خانة الاختيار أو مربع الإدخال، وكسر فقرة على مواقع نيولين مختلفة، وما إلى ذلك. هذه الاختلافات أكثر تعقيدا للتعامل معها من النقي التحول، دوران أو تحويل الحجم. علاوة على ذلك، إذا كانت صورتك صورة ثنائية (أبيض وأسود)، فلا أعتقد أن خوارزميات تسجيل الصور الطبية (تعمل على الصورة الرمادية الرمادية) ستساعد كثيرا. قد يتم تغيير وظيفة التكلفة واستراتيجيات التقليل وفقا لذلك.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top