سؤال

يمكنني استخدام أبي فينيريدر ل سكانسناب إلى التعرف الضوئي على الحروف اثنين من ملفات بدف الممسوحة ضوئيا.يدعي البرنامج أنه يحتفظ الصور بدف الأصلي.أحجام ملف بدف قبل التعرف الضوئي على الحروف وبعد التعرف الضوئي على الحروف متطابقة تقريبا ، وهو أمر جيد.

بعد الانتهاء من البرنامج ، تظهر جميع الصور بدف مكافحة المستعارة في أكروبات إكس.التنقل في الصفحة أبطأ بكثير من ذي قبل ، وعندما أقوم بالتكبير/التصغير ، تنتقل الصور أولا إلى ما يشبه إصدار ما قبل الصقل قبل التغيير بسرعة إلى صور غير مستعارة.

اليسار:بدف الممسوحة ضوئيا / صحيح:بعد التعرف الضوئي على الحروف مع آبي enter image description here

أود الحصول على الصور الأصلية دون تنعيم الظهر.ومن المثير للاهتمام ، عندما أفتح صفحة واحدة من بدف مكافحة المستعارة في فوتوشوب ، لا يوجد تنعيم والصورة تبدو وكأنها واحدة اليسار.

بلدي محدودة بدف تجربة البرمجة يقودني إلى الاعتقاد بأن آبي المرجح يضع نوعا من مكافحة الاسم المستعار العلم لكل صورة أثناء معالجة أوكر.كيف يمكنني إلغاء تعيين هذا العلم?

أي مؤشرات لأفكار مفيدة سيكون موضع تقدير كبير.

هل كانت مفيدة؟

المحلول

هناك /Interpolate true دخول في قاموس الصور من نسخة التعرف الضوئي على الحروف إد ، وهذا ما يسبب 'تنعيم'.سواء كان ذلك (وليس جبيغ 2000 بدلا من ضغط جبيغ) هو سبب تباطؤ ، يمكنك التحقق من الملفات الكبيرة بما فيه الكفاية.

لإلغاء تعيين هذا المفتاح ، سيكون الأفضل هو إيقاف تشغيله أثناء إنشاء ملف ، وإذا لم يكن ذلك ممكنا ، لكتابة وتشغيل برنامج صغير بلغة مناسبة.

ولكن ، منذ الملف الخاص بك لا الرياضة 'الكائنات المضغوطة' والمفتاح المخالف هو في عرض عادي داخل ملف ، في روح 'المهمة بسرعة' يمكنك ببساطة معالجة الملف الخاص بك على سبيل المثال.مثل هذا:

perl -M-encoding -0777pe "s!/Interpolate true!' 'x17!ge" <in.pdf >out.pdf

نصائح أخرى

بعد انتهاء البرنامج، تظهر جميع صور PDF مضاد للتعاسة في Acrobat X. Page Navigation أبطأ بكثير من ذي قبل، وعند التكبير / الخروج، اذهب الصور أولا إلى ما يبدو وكأنه ما قبل التعرجات الإصدار قبل التغيير بسرعة إلى الصور المضادة للتعيس.

في الواقع في الملف الأصلي 2013_11_15_22_51_31.pdf يحتوي على صورة JPEG أثناء تعضيب OCR 'ed file 2013_11_15_22_51_31_UCR.PDF يحتوي على صورة JPEG2000.

يقارنها في مشاهدي الطرف الثالث، يصبح من الواضح أن الصورة في ملف OCR'ED ليست بطبيعتها لمكافحة الاسم المستعار. علاوة على ذلك، لا يوجد أي علم واضح في PDF تعليمات من مشاهدي PDF لتطبيق مكافحة التعرج لصورة JPEG2000. وبالتالي، يبدو أن برنامج Adobe Reader يقوم تلقائيا بتقديم صور JPEG و JPEG2000 بشكل مختلف، وتطبيق مكافحة التعرجات إلى الأخير ولكن ليس إلى السابق.

مقارنة كلتا الصورتين بالتفصيل، على الرغم من ذلك، يصبح من الواضح أن هذه الصور ليست متطابقة ولكن بدلا من ذلك، فإن الصورة في PDF OCR'ed تدور قليلا.

أفترض ABBYY FINEREADER أن الصورة الأصلية الممسوحة ضوئيا غير موجهة بشكل صحيح. وبالتالي، فإنها تدورها قليلا لتصحيح هذا الاتجاه.

هكذا، استبدال الصورة في إصدار OCR'ED مع واحد من One of the Original One غير خيار: نظرا للتناوب، فإن معلومات التعرف الضوئي على الحروف التي ستكون جزئيا إلى حد ما.

ما قد ترغب في المحاولة هو إعادة عرض صورة JPEG2000 إلى JPEG واستبدال الصورة في إصدار OCR'ED مع هذا المرء الذي تم ترميمه. هذا يعني أن بعض فقدان الجودة ولكن على الأرجح يمكنك التخلص من التعرجات المضادة لهذه الطريقة.

كن على علم، على الرغم من أن صورة JPEG2000 أكبر قليلا من صورة JPEG لاستيعاب الدوران.

ps: كما أشار vadimr، هناك بالفعل إدخال حقيقي / مقبل في قاموس صورة OCR-ED فاتني عند النظر إلى الملف. هذا لا يبدو أن هذه هي المشكلة الرئيسية تبطئ التقديم.

jpeg الأصلي

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top