سؤال

أنا أعمل حاليًا على مشروع صغير باستخدام Finereader 11 SDK.لتحسين نتائجي، أحب العمل باستخدام قاموس مخصص.يعتمد محتوى القاموس على الكلمة الأولى في سطر معين

مثال:

Samsung Galaxy S3 ... many other word in this line
Apple Iphone 4 ... much more words
some more lines

فكرتي هي إعادة التعرف على الكلمة الأولى (Samsung أو Apple) وملء القاموس بكل الكلمات الممكنة بناءً على الكلمة الأولى (لـ Samsung:جالاكسي، S3، ...)

أي فكرة عن كيفية حل هذه المشكلة باستخدام Finereader

يعتبر

هل كانت مفيدة؟

المحلول

شكرا على التوضيح.إذن هذا ما يمكنك فعله في رأيي.ينطبق هذا على خط إنتاج FineReader، وبالطبع في SDK لديك تحكم أكثر تحديدًا عبر واجهة برمجة التطبيقات (API).

يتضمن برنامج FineReader OCR هذه القواميس:

  • قاموس مدمج - مجموعة كبيرة من الكلمات الشائعة وأشكالها المختلفة، وهي إحدى نقاط القوة في تقنية ABBYY OCR.ولا يحتوي على كلمات متخصصة مثل "Samsung" و"S3" على سبيل المثال.من خلال تحديد اللغة الشائعة، يمكنك تلقائيًا تشغيل القاموس المدمج لتلك اللغة.

  • القاموس المخصص - هذا هو القاموس الذي يمكنك إنشاؤه واستخدامه بمفرده أو بالاشتراك مع القاموس المدمج.

لذا، بالنسبة لمشروعك، أعتقد أنه من المنطقي استخدام القاموس المدمج، لأن عباراتك قد تحتوي على كلمات إنجليزية قياسية (لم تقدم لي عبارات كاملة لأراها، لذا قرر هذا بنفسك).

أعتقد أيضًا بشدة أنك بحاجة إلى إنشاء قاموس مخصص يضم العلامات التجارية والنماذج، وما إلى ذلك.إذا كان لديك هذا الخيار، ويبدو أنك تفعل ذلك.سيؤدي ذلك إلى تحسين التعرف بشكل كبير، خاصة بالنسبة للكلمات غير الطبيعية، مثل "S3"، لأن قواعد اللغة الشائعة تشير إلى أنه لا ينبغي خلط الحروف والأرقام.هذا من السهل جدا القيام به.

لا أرى حاليًا فائدة قراءة كل سطر باستخدام قاموس منفصل، إلا إذا كنت تعتقد أنه سيكون لديك تقاطع لكلمات متشابهة جدًا تنطبق على سطور مختلفة، وتريد هذه الكلمات في قواميس منفصلة ومرتبطة بكل سطر.ثم يمكنك إنشاء قواميس منفصلة، ​​وتشغيل كل قاموس للتعرف الثانوي بناءً على الكلمة الأولية.ومع ذلك، لتحقيق ذلك، تحتاج أولاً إلى الفصل إلى أسطر (في الذاكرة، أو في الواقع قص الصور) حتى تتمكن من معالجة كل منها على حدة باستخدام قاموس فريد.وهذا ممكن فقط في SDK مع قدر كبير من العمل.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top