Qual é a maneira mais fácil de merge (server-side) uma coleção de documentos PDF em um grande documento PDF em JAVA

StackOverflow https://stackoverflow.com/questions/90350

  •  01-07-2019
  •  | 
  •  

Pergunta

Eu tenho 3 documentos PDF que são gerados em tempo real por uma biblioteca de legado que usamos, e gravados no disco. Qual é a maneira mais fácil para o meu código de servidor Java para agarrar estes 3 documentos e transformá-los em um único documento PDF longo, onde é apenas todas as páginas do documento nº 1, seguido por todas as páginas do documento # 2, etc.

Idealmente, eu gostaria que isso aconteça na memória para que eu possa devolvê-lo como um fluxo para o cliente, mas escrevê-lo para o disco também é uma opção.

Foi útil?

Solução

@J D OConal, obrigado pela dica, o artigo que você me enviou era muito antiquado, mas ele fez ponto de me em direção iText. Eu encontrei esta página que explica como fazer exatamente o que eu preciso: http: //java-x.blogspot. com / 2006/11 / merge-pdf-arquivos-com-itext.html

Obrigado por outras respostas, mas eu realmente não quero ter que gerar outros processos se eu puder evitá-lo, e nosso projeto já tem itext.jar, então eu não estou adicionando quaisquer dependências externas

Aqui está o código que acabou escrevendo:

public class PdfMergeHelper {

    /**
     * Merges the passed in PDFs, in the order that they are listed in the java.util.List.
     * Writes the resulting PDF out to the OutputStream provided.
     * 
     * Sample Usage:
     * List<InputStream> pdfs = new ArrayList<InputStream>();
     * pdfs.add(new FileInputStream("/location/of/pdf/OQS_FRSv1.5.pdf"));
     * pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Contract_Genericv0.5.pdf"));
     * pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Quotev0.6.pdf"));
     * FileOutputStream output = new FileOutputStream("/location/to/write/to/merge.pdf");
     * PdfMergeHelper.concatPDFs(pdfs, output, true);
     * 
     * @param streamOfPDFFiles the list of files to merge, in the order that they should be merged
     * @param outputStream the output stream to write the merged PDF to
     * @param paginate true if you want page numbers to appear at the bottom of each page, false otherwise
     */
    public static void concatPDFs(List<InputStream> streamOfPDFFiles, OutputStream outputStream, boolean paginate) {
        Document document = new Document();
        try {
            List<InputStream> pdfs = streamOfPDFFiles;
            List<PdfReader> readers = new ArrayList<PdfReader>();
            int totalPages = 0;
            Iterator<InputStream> iteratorPDFs = pdfs.iterator();

            // Create Readers for the pdfs.
            while (iteratorPDFs.hasNext()) {
                InputStream pdf = iteratorPDFs.next();
                PdfReader pdfReader = new PdfReader(pdf);
                readers.add(pdfReader);
                totalPages += pdfReader.getNumberOfPages();
            }
            // Create a writer for the outputstream
            PdfWriter writer = PdfWriter.getInstance(document, outputStream);

            document.open();
            BaseFont bf = BaseFont.createFont(BaseFont.HELVETICA, BaseFont.CP1252, BaseFont.NOT_EMBEDDED);
            PdfContentByte cb = writer.getDirectContent(); // Holds the PDF
            // data

            PdfImportedPage page;
            int currentPageNumber = 0;
            int pageOfCurrentReaderPDF = 0;
            Iterator<PdfReader> iteratorPDFReader = readers.iterator();

            // Loop through the PDF files and add to the output.
            while (iteratorPDFReader.hasNext()) {
                PdfReader pdfReader = iteratorPDFReader.next();

                // Create a new page in the target for each source page.
                while (pageOfCurrentReaderPDF < pdfReader.getNumberOfPages()) {
                    document.newPage();
                    pageOfCurrentReaderPDF++;
                    currentPageNumber++;
                    page = writer.getImportedPage(pdfReader, pageOfCurrentReaderPDF);
                    cb.addTemplate(page, 0, 0);

                    // Code for pagination.
                    if (paginate) {
                        cb.beginText();
                        cb.setFontAndSize(bf, 9);
                        cb.showTextAligned(PdfContentByte.ALIGN_CENTER, "" + currentPageNumber + " of " + totalPages,
                                520, 5, 0);
                        cb.endText();
                    }
                }
                pageOfCurrentReaderPDF = 0;
            }
            outputStream.flush();
            document.close();
            outputStream.close();
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            if (document.isOpen()) {
                document.close();
            }
            try {
                if (outputStream != null) {
                    outputStream.close();
                }
            } catch (IOException ioe) {
                ioe.printStackTrace();
            }
        }
    }
}

Outras dicas

Eu usei pdftk com grande efeito. É um aplicativo externo que você vai ter que executar a partir de seu aplicativo java.

iText parece ter mudado e agora tem requisitos de licenciamento comercial, juntamente com não tão boa ajuda (documentação quer? Compre nosso livro!).

Nós acabou encontrando PDFSharp http://www.pdfsharp.net/ e usando isso. A amostra para concatenar vários documentos PDF em conjunto é simples e fácil de seguir: http: // www. pdfsharp.net/wiki/ConcatenateDocuments-sample.ashx

Aproveite Aleatório

Dê uma olhada neste href="http://java-source.net/open-source/pdf-libraries" rel="nofollow lista de Java bibliotecas open source PDF .

Também confira este artigo .

[Edit:? Há sempre Ghostscript, que é fácil de usar, mas quem quer mais dependências]

PDFBox é de longe a maneira mais fácil de conseguir isso, existe um utilitário chamado PDFMerger dentro do código que torna as coisas muito fácil, tudo o que me levou foi um loop e 2 linhas de código nele e tudo feito:)

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top