سؤال

pyPdf مكتبة كبيرة لتقسيم ودمج ملفات PDF.أنا استخدامه لتقسيم ملفات pdf إلى 1 صفحة من الوثائق.pyPdf هو محض الثعبان يقضي الكثير من الوقت في _sweepIndirectReferences() طريقة PdfFileWriter الكائن عند حفظ المستخرجة الصفحة.أنا بحاجة إلى شيء مع أداء أفضل.لقد حاولت استخدام متعدد خيوط ولكن منذ أكثر من الوقت الذي يقضيه في كود بايثون لا يوجد سرعة اكتساب لأنه من جيل (أنه ركض في الواقع أبطأ).

هل هناك أي مكتبة مكتوب في c التي توفر نفس وظيفة ؟ أو هل من أحد لديه فكرة جيدة حول كيفية تحسين الأداء (بخلاف التفريخ عملية جديدة لكل ملف pdf الذي أريد أن تقسيم)

شكرا لكم مقدما.

متابعة.روابط بضع سطر الأوامر الحلول التي يمكن أن تثبت في بعض الأحيان أسرع من pyPDF:

أنا تعديل pyPDF PdfWriter فئة تتبع كم من الوقت صرفت على _sweepIndirectReferences الأسلوب ().إذا كانت طويلة جدا (الآن يمكنني استخدام قيمة سحرية من 3 ثوان) ثم العودة إلى استخدام غوستسكريبت قبل إجراء مكالمة من بيثون.

شكرا على إجاباتك.(codelogic هو xpdf المرجعية هي التي جعلتني ابحث عن نهج مختلف)

هل كانت مفيدة؟

المحلول

mbtPdfAsm هو المصدر المفتوح أداة سطر الأوامر PDF المعالجة.

Xpdf الجدير بالذكر لأنه GPL و مكتوب في C++.شفرة المصدر هو نمطي يسمح للكتابة أدوات سطر الأوامر.

نصائح أخرى

هل يجب أن يكون الثعبان ؟ بلدي النقي-Perl المكتبة كام::PDF هو سريع جدا في إلحاق وحذف PDF صفحات المستند.فإنه يحفظ تجتاح النهاية ، حيثما أمكن.

pdfLaTex يمكن أن تفعل الكثير من PDF إدارة و هو جدا سريع.

لقد استعملت بعض معقدة جدا فرض worflows.تكس لغة غريبة حقا البرمجة, ولكن من السهل أن أكتب بيثون السيناريو الذي يولد الحاجة اللاتكس تخطيط العمليات.

هل حاولت استخدام Psyco مع pyPdf?

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top