Какой самый простой способ объединить (на стороне сервера) коллекцию PDF-документов в один большой PDF-документ в JAVA?

StackOverflow https://stackoverflow.com/questions/90350

  •  01-07-2019
  •  | 
  •  

Вопрос

У меня есть 3 PDF-документа, которые генерируются на лету устаревшей библиотекой, которую мы используем, и записываются на диск.Какой самый простой способ для моего кода JAVA-сервера получить эти 3 документа и превратить их в один длинный PDF-документ, в котором будут только все страницы из документа № 1, за которыми следуют все страницы из документа № 2 и т. д.

В идеале мне бы хотелось, чтобы это происходило в памяти, чтобы я мог вернуть его клиенту в виде потока, но также возможен вариант записи на диск.

Это было полезно?

Решение

@J D OConal, спасибо за совет, статья, которую вы мне прислали, была очень устаревшей, но она указала мне на iText.Я нашел эту страницу, которая объясняет, как сделать именно то, что мне нужно:http://java-x.blogspot.com/2006/11/merge-pdf-files-with-itext.html

Спасибо за другие ответы, но мне не хочется запускать другие процессы, если можно этого избежать, а в нашем проекте уже есть itext.jar, поэтому я не добавляю никаких внешних зависимостей.

Вот код, который я в итоге написал:

public class PdfMergeHelper {

    /**
     * Merges the passed in PDFs, in the order that they are listed in the java.util.List.
     * Writes the resulting PDF out to the OutputStream provided.
     * 
     * Sample Usage:
     * List<InputStream> pdfs = new ArrayList<InputStream>();
     * pdfs.add(new FileInputStream("/location/of/pdf/OQS_FRSv1.5.pdf"));
     * pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Contract_Genericv0.5.pdf"));
     * pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Quotev0.6.pdf"));
     * FileOutputStream output = new FileOutputStream("/location/to/write/to/merge.pdf");
     * PdfMergeHelper.concatPDFs(pdfs, output, true);
     * 
     * @param streamOfPDFFiles the list of files to merge, in the order that they should be merged
     * @param outputStream the output stream to write the merged PDF to
     * @param paginate true if you want page numbers to appear at the bottom of each page, false otherwise
     */
    public static void concatPDFs(List<InputStream> streamOfPDFFiles, OutputStream outputStream, boolean paginate) {
        Document document = new Document();
        try {
            List<InputStream> pdfs = streamOfPDFFiles;
            List<PdfReader> readers = new ArrayList<PdfReader>();
            int totalPages = 0;
            Iterator<InputStream> iteratorPDFs = pdfs.iterator();

            // Create Readers for the pdfs.
            while (iteratorPDFs.hasNext()) {
                InputStream pdf = iteratorPDFs.next();
                PdfReader pdfReader = new PdfReader(pdf);
                readers.add(pdfReader);
                totalPages += pdfReader.getNumberOfPages();
            }
            // Create a writer for the outputstream
            PdfWriter writer = PdfWriter.getInstance(document, outputStream);

            document.open();
            BaseFont bf = BaseFont.createFont(BaseFont.HELVETICA, BaseFont.CP1252, BaseFont.NOT_EMBEDDED);
            PdfContentByte cb = writer.getDirectContent(); // Holds the PDF
            // data

            PdfImportedPage page;
            int currentPageNumber = 0;
            int pageOfCurrentReaderPDF = 0;
            Iterator<PdfReader> iteratorPDFReader = readers.iterator();

            // Loop through the PDF files and add to the output.
            while (iteratorPDFReader.hasNext()) {
                PdfReader pdfReader = iteratorPDFReader.next();

                // Create a new page in the target for each source page.
                while (pageOfCurrentReaderPDF < pdfReader.getNumberOfPages()) {
                    document.newPage();
                    pageOfCurrentReaderPDF++;
                    currentPageNumber++;
                    page = writer.getImportedPage(pdfReader, pageOfCurrentReaderPDF);
                    cb.addTemplate(page, 0, 0);

                    // Code for pagination.
                    if (paginate) {
                        cb.beginText();
                        cb.setFontAndSize(bf, 9);
                        cb.showTextAligned(PdfContentByte.ALIGN_CENTER, "" + currentPageNumber + " of " + totalPages,
                                520, 5, 0);
                        cb.endText();
                    }
                }
                pageOfCurrentReaderPDF = 0;
            }
            outputStream.flush();
            document.close();
            outputStream.close();
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            if (document.isOpen()) {
                document.close();
            }
            try {
                if (outputStream != null) {
                    outputStream.close();
                }
            } catch (IOException ioe) {
                ioe.printStackTrace();
            }
        }
    }
}

Другие советы

я использовал pdftk с большим эффектом.Это внешнее приложение, которое вам придется запускать из вашего Java-приложения.

iText, кажется, изменился и теперь имеет требования к коммерческому лицензированию, а также не очень хорошую помощь (Хотите документацию?Купите нашу книгу!).

В итоге мы нашли PDFSharp http://www.pdfsharp.net/ и используя это.Пример объединения нескольких PDF-документов прост и удобен для выполнения: http://www.pdfsharp.net/wiki/ConcatenateDocuments-sample.ashx

Наслаждайтесь случайным

Взгляни на это список PDF-библиотек Java с открытым исходным кодом.

Также проверьте Эта статья.

[Редактировать:Всегда есть Ghostscript, который прост в использовании, но кому нужно больше зависимостей?]

PDFBox на сегодняшний день это самый простой способ добиться этого, в коде есть утилита под названием PDFMerger, которая делает все очень просто, все, что мне потребовалось, это цикл for и 2 строки кода в нем, и все готово :)

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top