Qual é a maneira mais fácil de merge (server-side) uma coleção de documentos PDF em um grande documento PDF em JAVA
-
01-07-2019 - |
Pergunta
Eu tenho 3 documentos PDF que são gerados em tempo real por uma biblioteca de legado que usamos, e gravados no disco. Qual é a maneira mais fácil para o meu código de servidor Java para agarrar estes 3 documentos e transformá-los em um único documento PDF longo, onde é apenas todas as páginas do documento nº 1, seguido por todas as páginas do documento # 2, etc.
Idealmente, eu gostaria que isso aconteça na memória para que eu possa devolvê-lo como um fluxo para o cliente, mas escrevê-lo para o disco também é uma opção.
Solução
@J D OConal, obrigado pela dica, o artigo que você me enviou era muito antiquado, mas ele fez ponto de me em direção iText. Eu encontrei esta página que explica como fazer exatamente o que eu preciso: http: //java-x.blogspot. com / 2006/11 / merge-pdf-arquivos-com-itext.html
Obrigado por outras respostas, mas eu realmente não quero ter que gerar outros processos se eu puder evitá-lo, e nosso projeto já tem itext.jar, então eu não estou adicionando quaisquer dependências externas
Aqui está o código que acabou escrevendo:
public class PdfMergeHelper {
/**
* Merges the passed in PDFs, in the order that they are listed in the java.util.List.
* Writes the resulting PDF out to the OutputStream provided.
*
* Sample Usage:
* List<InputStream> pdfs = new ArrayList<InputStream>();
* pdfs.add(new FileInputStream("/location/of/pdf/OQS_FRSv1.5.pdf"));
* pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Contract_Genericv0.5.pdf"));
* pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Quotev0.6.pdf"));
* FileOutputStream output = new FileOutputStream("/location/to/write/to/merge.pdf");
* PdfMergeHelper.concatPDFs(pdfs, output, true);
*
* @param streamOfPDFFiles the list of files to merge, in the order that they should be merged
* @param outputStream the output stream to write the merged PDF to
* @param paginate true if you want page numbers to appear at the bottom of each page, false otherwise
*/
public static void concatPDFs(List<InputStream> streamOfPDFFiles, OutputStream outputStream, boolean paginate) {
Document document = new Document();
try {
List<InputStream> pdfs = streamOfPDFFiles;
List<PdfReader> readers = new ArrayList<PdfReader>();
int totalPages = 0;
Iterator<InputStream> iteratorPDFs = pdfs.iterator();
// Create Readers for the pdfs.
while (iteratorPDFs.hasNext()) {
InputStream pdf = iteratorPDFs.next();
PdfReader pdfReader = new PdfReader(pdf);
readers.add(pdfReader);
totalPages += pdfReader.getNumberOfPages();
}
// Create a writer for the outputstream
PdfWriter writer = PdfWriter.getInstance(document, outputStream);
document.open();
BaseFont bf = BaseFont.createFont(BaseFont.HELVETICA, BaseFont.CP1252, BaseFont.NOT_EMBEDDED);
PdfContentByte cb = writer.getDirectContent(); // Holds the PDF
// data
PdfImportedPage page;
int currentPageNumber = 0;
int pageOfCurrentReaderPDF = 0;
Iterator<PdfReader> iteratorPDFReader = readers.iterator();
// Loop through the PDF files and add to the output.
while (iteratorPDFReader.hasNext()) {
PdfReader pdfReader = iteratorPDFReader.next();
// Create a new page in the target for each source page.
while (pageOfCurrentReaderPDF < pdfReader.getNumberOfPages()) {
document.newPage();
pageOfCurrentReaderPDF++;
currentPageNumber++;
page = writer.getImportedPage(pdfReader, pageOfCurrentReaderPDF);
cb.addTemplate(page, 0, 0);
// Code for pagination.
if (paginate) {
cb.beginText();
cb.setFontAndSize(bf, 9);
cb.showTextAligned(PdfContentByte.ALIGN_CENTER, "" + currentPageNumber + " of " + totalPages,
520, 5, 0);
cb.endText();
}
}
pageOfCurrentReaderPDF = 0;
}
outputStream.flush();
document.close();
outputStream.close();
} catch (Exception e) {
e.printStackTrace();
} finally {
if (document.isOpen()) {
document.close();
}
try {
if (outputStream != null) {
outputStream.close();
}
} catch (IOException ioe) {
ioe.printStackTrace();
}
}
}
}
Outras dicas
Eu usei pdftk com grande efeito. É um aplicativo externo que você vai ter que executar a partir de seu aplicativo java.
iText parece ter mudado e agora tem requisitos de licenciamento comercial, juntamente com não tão boa ajuda (documentação quer? Compre nosso livro!).
Nós acabou encontrando PDFSharp http://www.pdfsharp.net/ e usando isso. A amostra para concatenar vários documentos PDF em conjunto é simples e fácil de seguir: http: // www. pdfsharp.net/wiki/ConcatenateDocuments-sample.ashx
Aproveite Aleatório
Dê uma olhada neste href="http://java-source.net/open-source/pdf-libraries" rel="nofollow lista de Java bibliotecas open source PDF .
Também confira este artigo .
[Edit:? Há sempre Ghostscript, que é fácil de usar, mas quem quer mais dependências]
PDFBox é de longe a maneira mais fácil de conseguir isso, existe um utilitário chamado PDFMerger dentro do código que torna as coisas muito fácil, tudo o que me levou foi um loop e 2 linhas de código nele e tudo feito:)