سؤال

تصبح على خير :)

أنا ألعب حاليا مع مكتبة الشيطان التي تسمح لي بالتحميل في الصورة وتحقق من قيم RGB لكل بكسل. تماما بمثابة مشروع تعليمي شخصي، أحاول كتابة نظام التعرف الضوئي المستخدم الأساسي للغاية لبضعة صور صنعت نفسي في فوتوشوب.

أنا قادر بنجاح على إزالة جميع التشوهات في الصورة وتركها مع النص والأرقام. أنا حاليا لا أبحث عن شبكة عصبية متقدمة تتعلم من المدخلات. أريد أن أبدأ بسهولة نسبيا، ولذا فقد قمت بتحديد الأحرف الفردية وحساب البكسلات في تلك الأحرف.

لدي مشاكل:

  • تحديد الشخصيات الفردية.
  • الأهم من ذلك: أحتاج إلى خوارزمية لحساب البكسلات المرتبطة (من نفس اللون) دون حساب البكسل الذي عدت سابقا. ليس لدي خلفية رياضية، لذلك هذه هي القضية الأكبر بالنسبة لي.

أي مساعدة في الأمر هي موضع تقدير، شكرا.

تعديل:

لقد وصفت بهذه السؤال ك C ++ لأن هذا ما أستخدمه حاليا. ومع ذلك، فإن رمز الزائفة أو رمز قابل للقراءة بسهولة من لغة أخرى هو أيضا على ما يرام.

هل كانت مفيدة؟

المحلول

ال ملء الفيضانات ستعمل الخوارزمية على حساب وحدات البكسل المشمولة، طالما أن لديك الصور التي تمت تصفيةها وصولا إلى الصور النقطية بالأبيض والأسود البسيطة.

بعد القول أنه يمكنك إجراء اعتراف بالشخصية من خلال مقارنة كل حرف بمجموعة من الصور القياسية لكل حرف في مجموعتك، وقياس التشابه، ثم اختيار الشخصية بأعلى درجات.

إلقاء نظرة على هذا السؤال للمزيد من المعلومات.

نصائح أخرى

لست متأكدا من أن هذا يساعد، ولكن هناك GPL OCR Lib يسمى جوارق.

الاعتذار إذا كان هذا بعيدا جدا عن الموضوع، ولكن IMHO Vigra. (ليس الآخر!) هي مكتبة معالجة صور أفضل بكثير ل C ++ من الشيطان.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top