ما البرنامج الذي توصي به لتحسين الصورة قبل التعرف الضوئي على الحروف (OCR)؟[مغلق]

StackOverflow https://stackoverflow.com/questions/142743

سؤال

نحن نبحث حاليًا عن طرق لتحسين جودة الصورة قبل إرسالها إلى التعرف الضوئي على الحروف (OCR).محرك التعرف الضوئي على الحروف (OCR) الذي نستخدمه حاليًا هو Scansoft API من Nuance (الإصدار 15).كنا نبحث في أدوات الرصاص ولكن منذ ذلك الحين قررت البحث في مكان آخر.تكاليف الترخيص المرتبطة بأدوات العملاء المحتملين كبيرة جدًا.في البداية، نحن نبحث عن ميزات بسيطة لتحسين الصورة مثل:إزالة البقع، إزالة الخطوط، إزالة الثقب، الشحذ، إلخ.نحن نقوم بتشغيل مزيج من برامج .NET وJava، ولكن سيكون حل Java هو المفضل.

هل كانت مفيدة؟

المحلول

يعتبر Kofax مفيدًا للمعالجة المسبقة، ولكن بالنسبة لأنواع التنظيف التي تتحدث عنها قد تكون مبالغة ما لم تكن الصور سيئة حقًا.ما لم يكن تخصصك هو معالجة الصور، فإنني أوصي بالعمل مع موفر يقوم بتنظيف الصورة والتعرف الضوئي على الحروف (OCR) حتى تتمكن من التركيز على القيمة التي تضيفها بالفعل.

نحن نرخص مجموعة أدوات تطوير التعرف الضوئي على الحروف (OCR) من ABBYY (آبي SDK) ووجدته رائعًا في معالجة الصور والتعرف الضوئي على الحروف (OCR).واجهة برمجة التطبيقات (API) واسعة جدًا، وكانت نماذج التطبيقات والمساعدة والدعم مذهلة للغاية.أوصي بالتأكيد بإلقاء نظرة.

نصائح أخرى

تنصل:أنا أعمل في أتالاسوفت

لدينا هذه الوظائف وترخيص بدون حقوق ملكية لوقت التشغيل لـ .NET.

http://www.atalasoft.com/products/dotimage/

لدينا أيضًا مكونات التعرف الضوئي على الحروف بما في ذلك غلاف .NET لـ Abbyy وTesseract وغيرهما وإنشاء ملفات PDF قابلة للبحث (صورة أعلى النص في ملف PDF)

لست متأكدًا مما إذا كان هذا سيتوافق تمامًا مع المعايير التي تحتاجونها يا رفاق، ولكن ربما ينبغي عليكم إلقاء نظرة على بعض منها Paint.Net واجهات برمجة التطبيقات.لا أعرف مدى سهولة استخراج خوارزميات معالجة الصور الخاصة بهم لاستخدامها في مشروعك، لكنني أعتقد أنهم يقومون ببعض الأشياء التي تبحث عنها.بالإضافة إلى أنه مشروع مفتوح المصدر مع ترخيص MIT، لذلك يجب أن يكون سهل الاستخدام للغاية للاستخدام التجاري.

ابحث عن KOFAX VRS على KOFAX.com

ربما JMagick، إنها واجهة Java مفتوحة المصدر لـ ImageMagick.يتم تنفيذه في شكل طبقة رقيقة من Java Native Interface (JNI) في ImageMagick API.إنه مرخص بموجب LGPL لذا لا ينبغي أن يكون هناك مشكلة في الترخيص.

http://sourceforge.net/projects/jmagick/

أود أن أقترح شركة انتل لترخيص وقت التشغيل بدون تكلفة.

يعتمد على عدد الصور الأصلية وجودتها.ستعمل مجموعات أدوات التعليمات البرمجية والتصوير المُدارة ولكنها ليست دائمًا الحل الأفضل إذا كان لديك عدة ملايين من الصور للمعالجة.بالنسبة للدفعات الصغيرة والميزانيات المحدودة، أتفق مع الملصقات السابقة التي تعجب المشاريع فورج، Paint.NET, ، وغيرها من مكتبات رؤية الكمبيوتر مفتوحة المصدر ستفي بالغرض.وبالطبع أنت وحدك إذا لم تتحسن النتائج...يتيح لك هذا على الأقل وضع كل ما تحتاجه في تطبيق واحد بتكلفة منخفضة.

إذا كنت تقوم بمعالجة عدة مئات الآلاف من الصور شهريًا، فأنا أقترح عليك تقسيم العملية إلى خطوات سير عمل أصغر وتعديل كل واحدة حتى تقترب التكلفة لكل صورة من الصفر قدر الإمكان.ستجد أن نتائج التعرف الضوئي على الحروف ترتفع بسرعة في البداية ثم تستقر في وقت أقرب مما كنت تتوقع.(لست من أشد المعجبين بتقنية التعرف الضوئي على الحروف ولكن لها مكانها)

أستخدم منتج Windows التجاري من التعرف على لمعالجة الصور وتنظيفها قبل التعرف الضوئي على الحروف (OCR) في الوضع الدفعي باستخدام البرامج النصية المعدلة لأنواع مختلفة من الصور.إذا فشلت الصورة في مراقبة الجودة أو تم رفضها بواسطة محرك التعرف الضوئي على الحروف، فسيتم "إصلاحها" يدويًا باستخدام تطبيق .NET مخصص تم إنشاؤه باستخدام أتالاسوفت أدوات.قم بمعالجة كل شيء دفعة واحدة ولمس فقط ما فشل.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top