سؤال

أحتاج إلى مكتبة يمكنها اكتشاف الكائنات في صورة (تستخدم الكشف عن الحافة). هذا لا يرتبط بـ Captchas. أنا أعمل على روبوت MTGO يستخدم التعرف الضوئي على الحروف ويعمل في أي دقة شاشة. لكي تنقلها إلى أي دقة شاشة ، فإن فكرتي هي مسح النطاق الضيق على صفحة النتائج (يمكن إدراج البطاقات التي يمتلكها المشغل في صفوف من النص) ولإيجاد كل كائن في هذا النطاق. ثم لأخذ أدنى وأعلى إحداثيات بكسل لكل كائن للعثور على مكان يبدأ الصف وينتهي (على محور Y) حتى أتمكن من استخدام OCR لقراءة كل سطر.

هل كانت مفيدة؟

المحلول

إذا كنت لا تعرف OpenCV مجموعة من الأمثلة ، ثم يمكن أن تساعدك في الاتجاه الصحيح ... هناك أيضا كاميليا التي لا تستخدم "الكشف عن الحافة" لكل SE ولكن يمكن أن تحصل على النتائج التي تحتاجها مع القليل من العمل.

نصائح أخرى

إنها ليست رخيصة ، لكنني استخدمت بدايات معالجة Intel ، وقد تأثرت بشدة بأدائها. إنهم يعملون على معالجات Intel و AMD ، وكذلك Windows و Linux

ربما سيكون هذا مفيدًا:

ال مكتبة SIMD هي مكتبة معالجة الصور مفتوحة المصدر مجانية ، مصممة لمبرمجي C و C ++. يوفر العديد من خوارزميات الأداء العالية المفيدة لمعالجة الصور مثل: تحويل تنسيق البكسل ، وتوسيع نطاق الصور وترشيحها ، واستخراج المعلومات الإحصائية من الصور ، والكشف عن الحركة. يتم تحسين الخوارزميات باستخدام امتدادات SIMD المختلفة. على وجه الخصوص ، تدعم المكتبة امتدادات وحدة المعالجة المركزية: SSE ، SSE2 ، SSSE3 ، SSE4.1 ، SSE4.2 ، AVX و AVX2 لـ X86/X64 ، VMX (Altivec) و VSX (Power7) لـ PowerPC و Neon for Arm. تحتوي مكتبة SIMD على API C وتحتوي أيضًا على فئات C ++ مفيدة ووظائف لتسهيل الوصول إلى C API. تدعم المكتبة الربط الديناميكي والستاتي ، ونوافذ 32 بت و 64 بت و Linux و MSVs و G ++ ، ومشروع MSVS وأنظمة إنشاء CMake.

إلقاء نظرة على أدوات الرصاص التصوير SDKs؟ ليست حرة ، ولكن شاملة جدا.

tesseract-ocr ؟ (ترخيص Apache 2.0)

Framewave على أساس مكتبة أداء AMD الذي يوفر ميزات لمعالجة الصور. تحقق أيضا ذات الصلة مكتبات معالجة الصور C/C ++ السريعة

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top