سؤال

لقد بحثت حولها للمصدر المفتوح OCR للصينيين. ولكن دون أي حظ، يبدو أن هناك بعض المصدر المفتوح OCR (للصينيين) الذي يمكن استخدامه.

لذلك أنا هنا أتساءل:

  1. هل هناك أي مصدر OCR مفتوح للصينيين الذين يمكن استخدامها في بيئة الإنتاج؟

  2. ما هي الاختلافات الرئيسية عند تنفيذ OCR للغات اللاتينية والصينية؟ أعرف أن بعض التعرف الضوئي على الحروف الجيدة مثل tesseract أو ocropus، ماذا علي أن أفعل إذا كنت أريد أن أجعلها تدعم اللغة الصينية؟

أي مساعدة موضع تقدير وشكرا مقدما ~

هل كانت مفيدة؟

المحلول

يمكنك اختيار:

  • TESSERACT 3.0 دعم الصينية / اليابانية
  • الدعم nhocr اليابانية

نصائح أخرى

الصينية لديه أحرف أكثر بكثير من اللغات اللاتينية. هناك بعض المنتجات التجارية. واحدة من الطرق هي الاتصال بهم والحصول على المساعدة.

لا أعتقد أن هناك مصدر مفتوح للشخصيات الصينية أو اليابانية. في مجال OCR، هناك الكثير من التقنيات خارج خوارزميات التعرف على نمط، حيث تكون الشركة جيدة في مجتمع المصدر المفتوح.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top