JAVA で PDF ドキュメントのコレクションを 1 つの大きな PDF ドキュメントに (サーバー側で) マージする最も簡単な方法は何ですか?
-
01-07-2019 - |
質問
私たちが使用している従来のライブラリによってオンザフライで生成され、ディスクに書き込まれた PDF ドキュメントが 3 つあります。私の JAVA サーバー コードでこれら 3 つのドキュメントを取得し、ドキュメント #1 のすべてのページ、次にドキュメント #2 のすべてのページなどを含む 1 つの長い PDF ドキュメントに変換する最も簡単な方法は何ですか。
理想的には、これをメモリ内で実行してクライアントにストリームとして返せるようにしたいのですが、ディスクに書き込むこともできます。
解決
@J D OConal、ヒントをありがとう。あなたが私に送ってくれた記事は非常に古いものでしたが、それは私に iText を教えてくれました。私が必要なことを正確に行う方法を説明するこのページを見つけました。http://java-x.blogspot.com/2006/11/merge-pdf-files-with-itext.html
他の回答もありがとうございます。ただし、回避できれば他のプロセスを生成する必要はありません。プロジェクトにはすでに itext.jar があるため、外部依存関係は追加しません。
最終的に書いたコードは次のとおりです。
public class PdfMergeHelper {
/**
* Merges the passed in PDFs, in the order that they are listed in the java.util.List.
* Writes the resulting PDF out to the OutputStream provided.
*
* Sample Usage:
* List<InputStream> pdfs = new ArrayList<InputStream>();
* pdfs.add(new FileInputStream("/location/of/pdf/OQS_FRSv1.5.pdf"));
* pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Contract_Genericv0.5.pdf"));
* pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Quotev0.6.pdf"));
* FileOutputStream output = new FileOutputStream("/location/to/write/to/merge.pdf");
* PdfMergeHelper.concatPDFs(pdfs, output, true);
*
* @param streamOfPDFFiles the list of files to merge, in the order that they should be merged
* @param outputStream the output stream to write the merged PDF to
* @param paginate true if you want page numbers to appear at the bottom of each page, false otherwise
*/
public static void concatPDFs(List<InputStream> streamOfPDFFiles, OutputStream outputStream, boolean paginate) {
Document document = new Document();
try {
List<InputStream> pdfs = streamOfPDFFiles;
List<PdfReader> readers = new ArrayList<PdfReader>();
int totalPages = 0;
Iterator<InputStream> iteratorPDFs = pdfs.iterator();
// Create Readers for the pdfs.
while (iteratorPDFs.hasNext()) {
InputStream pdf = iteratorPDFs.next();
PdfReader pdfReader = new PdfReader(pdf);
readers.add(pdfReader);
totalPages += pdfReader.getNumberOfPages();
}
// Create a writer for the outputstream
PdfWriter writer = PdfWriter.getInstance(document, outputStream);
document.open();
BaseFont bf = BaseFont.createFont(BaseFont.HELVETICA, BaseFont.CP1252, BaseFont.NOT_EMBEDDED);
PdfContentByte cb = writer.getDirectContent(); // Holds the PDF
// data
PdfImportedPage page;
int currentPageNumber = 0;
int pageOfCurrentReaderPDF = 0;
Iterator<PdfReader> iteratorPDFReader = readers.iterator();
// Loop through the PDF files and add to the output.
while (iteratorPDFReader.hasNext()) {
PdfReader pdfReader = iteratorPDFReader.next();
// Create a new page in the target for each source page.
while (pageOfCurrentReaderPDF < pdfReader.getNumberOfPages()) {
document.newPage();
pageOfCurrentReaderPDF++;
currentPageNumber++;
page = writer.getImportedPage(pdfReader, pageOfCurrentReaderPDF);
cb.addTemplate(page, 0, 0);
// Code for pagination.
if (paginate) {
cb.beginText();
cb.setFontAndSize(bf, 9);
cb.showTextAligned(PdfContentByte.ALIGN_CENTER, "" + currentPageNumber + " of " + totalPages,
520, 5, 0);
cb.endText();
}
}
pageOfCurrentReaderPDF = 0;
}
outputStream.flush();
document.close();
outputStream.close();
} catch (Exception e) {
e.printStackTrace();
} finally {
if (document.isOpen()) {
document.close();
}
try {
if (outputStream != null) {
outputStream.close();
}
} catch (IOException ioe) {
ioe.printStackTrace();
}
}
}
}
他のヒント
使ったことがある pdftk 大きな効果をもたらします。これは、Java アプリから実行する必要がある外部アプリケーションです。
iText は変更されたようで、商用ライセンスが必要になり、ヘルプもあまり良くありません (ドキュメントが必要ですか?私たちの本を買ってください!)。
結局PDFSharpを見つけました http://www.pdfsharp.net/ そしてそれを使って。複数の PDF ドキュメントを連結するサンプルはシンプルで理解しやすいです。 http://www.pdfsharp.net/wiki/ConcatenateDocuments-sample.ashx
ランダムをお楽しみください
これをみて Java オープンソース PDF ライブラリのリスト.
こちらもチェックしてください この記事.
[編集:使いやすい Ghostscript は常にありますが、より多くの依存関係を望む人がいるでしょうか。]
PDFボックス これを実現する最も簡単な方法は、コード内に PDFMerger というユーティリティがあり、これを使用すると作業が非常に簡単になります。必要なのは、for ループとその中の 2 行のコードだけで、すべて完了しました :)