سؤال

تكرار ممكن:
أداة لمقارنة أعداد كبيرة من ملفات PDF؟

أنا في السيناريو الكلاسيكي حيث يمنحك العمل مجموعة من الجديد نماذج PDF للعام الجديد مع عدم وجود ملاحظات مراجعة على الإطلاق ، ومن المفترض أن تعرف ما هو مختلف عن تلك السنة السابقة.

أنا أتحدث عن الكثير من النماذج هنا ، لذلك أحاول إيجاد طريقة لمقارنة ملفات PDF لتحديد الاختلافات دون أن تجعل الناس يدويون كل واحد منهم يدويًا.

كانت فكرتي هي استخراج جميع النصوص من PDFs وتفريغها في .txt ثم قم بتشغيل الاختلافات على الملفات النصية ، لكنها تبدو فظيعة.

سؤالي يقول برمجياً ، لكنني سأكون سعيدًا بأي أدوات موثوقة لمقارنة PDFs ، وأتطلع بشكل رئيسي للحصول على فكرة من تجارب الناس. على استعداد أيضًا للترفيه عن أي حلول برمجية (ويفضل أن يكون ذلك في C# ولكن PLS أطلقوا النار أي الأفكار).

هل كانت مفيدة؟

المحلول

هناك عدد غير قليل من منتجات البرمجيات التي تدعي Diff PDFs. لم أكن بحاجة أبدًا إلى استخدام واحدة ، لكن إذا كانت هذه عملية متكررة ، أعتقد أنه سيكون من الحكمة أن تستثمر شركتك في أحدها. فقط Google "PDF Diff" لمجموعة من التطبيقات المحتملة.

بالإضافة إلى ذلك ، فإن وضعك مشابه جدًا لهذا السؤال: أداة لمقارنة أعداد كبيرة من ملفات PDF؟ أعتقد أن مناقشتها قد تساعد.

نصائح أخرى

أنا مطور Docotic.pdf مكتبة. نستخدم مقارنة PDF في اختبارات الوحدة للتحقق من أن الاختبار ينتج PDF كما هو متوقع. PDF هي مجموعة من الكائنات الخاصة ونقارن جميع كائنات PDF وتجاهل بعض الخصائص مثل معرفات المقطورة ومعلومات المبدع. هذا التنفيذ يعمل بشكل جيد.

يمكنك تجربة الطريقة pdfdocument.documentsareequal. هذه الطريقة تخبرك بأنك مستندات متساوية ، دون اختلافات محددة. يمكنك الاتصال بنا إذا كنت بحاجة إلى مزيد من الوظائف.

لقد ذهبت إلى نهج إخراج البيانات الأولية من PDF ، ثم الاستفادة من Word أو TorusiseVn ، أو Winmerge ، وما إلى ذلك ... لرعاية قطعة المقارنة. في حالتي ، قمت بالمقارنة في صندوق RichText في C#... تلوين الاختلافات ، إلخ ... نظرًا لأننا أردنا كل شيء داخل تطبيقنا.

هذا ما فعلته ...مقارنة PDF بينما كنت أحاول مقارنة المستندات المختلطة ، Word و PDF.

ومع ذلك ، أود أن أوصي PDFBox بالحجز ، أكثر أناقة قليلاً ... على الرغم من أن ItextSharp عمل على ما يرام ...

كتبت مدونة تقترح بعض الأساليب لمقارنة ملفات PDF في https://blog.idrsolutions.com/2010/09/comparing-2-pdf-files/

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top