التعرف الضوئي على الحروف (OCR) مع واجهة Tesseract

StackOverflow https://stackoverflow.com/questions/30328

  •  09-06-2019
  •  | 
  •  

سؤال

كيف يمكنك التعرف الضوئي على الحروف لملف tiff باستخدام واجهة Tesseract في c#؟
حاليًا لا أعرف سوى كيفية القيام بذلك باستخدام الملف القابل للتنفيذ.

هل كانت مفيدة؟

المحلول

يبدو أن التعليمات البرمجية المصدر موجهة لملف قابل للتنفيذ، وقد تحتاج إلى إعادة توصيل العناصر قليلاً بحيث يتم إنشاؤها كملف DLL بدلاً من ذلك.ليس لدي الكثير من الخبرة في استخدام Visual C++ ولكن أعتقد أنه لا ينبغي أن يكون الأمر صعبًا مع بعض الأبحاث.أعتقد أن شخصًا ما ربما يكون قد قام بإنشاء نسخة مكتبة بالفعل، فيجب عليك تجربة Google.

بمجرد حصولك على كود tesseract-ocr في ملف DLL، يمكنك بعد ذلك استيراد الملف إلى مشروع C# الخاص بك عبر Visual Studio وجعله ينشئ فئات مجمعة ويقوم بجميع عناصر التنظيم نيابةً عنك.إذا لم تتمكن من الاستيراد بعد ذلك DllImport سيسمح لك باستدعاء الوظائف الموجودة في DLL من رمز C#.

ثم يمكنك إلقاء نظرة على الملف الأصلي القابل للتنفيذ للعثور على أدلة حول الوظائف التي يجب الاتصال بها للتعرف الضوئي على الحروف (OCR) على صورة مشاجرة بشكل صحيح.

نصائح أخرى

نلقي نظرة على تيسنيت

يقوم برنامج C# بتشغيل tesseract.exe ثم يقرأ ملف الإخراج الخاص بـ tesseract.exe.

Process process = Process.Start("tesseract.exe", "out");
process.WaitForExit();
if (process.ExitCode == 0)
{
    string content = File.ReadAllText("out.txt");
}

لقد اكتشفت اليوم ذلك إي إم جي يو يتضمن الآن غلاف Tesseract.على الرغم من أن عدد ملفات dll غير المُدارة في opencv lib قد يبدو أمرًا شاقًا بعض الشيء، إلا أنه لا يوجد شيء لن تتمكن من علاجه نسخة سريعة إلى دليل الإخراج الخاص بك.ومن هناك، تكون عملية التعرف الضوئي على الحروف (OCR) بسيطة ولا تتعدى ثلاثة أسطر:

Tesseract ocr = new Tesseract(Path.Combine(Environment.CurrentDirectory, "tessdata"), "eng", Tesseract.OcrEngineMode.OEM_TESSERACT_ONLY);
this.ocr.Recognize(clip);
optOCR.Text = this.ocr.GetText();

"الروبوتات" مجتمعة فيديو يوتيوب جميل جدا وهذا يوضح حلاً بسيطًا ولكنه فعال.

تنصل:أنا أعمل في أتالاسوفت

ملكنا وحدة التعرف الضوئي على الحروف تدعم Tesseract وإذا ثبت أن ذلك ليس جيدًا بما فيه الكفاية، فيمكنك الترقية إلى محرك أفضل وتغيير سطر واحد فقط من التعليمات البرمجية (نحن نقدم واجهة مشتركة لمحركات التعرف الضوئي على الحروف المتعددة).

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top