Объединить два (или более) файла PDF
Вопрос
Предыстория: Мне нужно предоставить пакет еженедельных отчетов для моего торгового персонала.Этот пакет содержит несколько (5-10) отчетов crystal reports.
Проблема: Я хотел бы разрешить пользователю запускать все отчеты, а также просто запускать один отчет.Я думал, что мог бы сделать это, создав отчеты, а затем выполнив:
List<ReportClass> reports = new List<ReportClass>();
reports.Add(new WeeklyReport1());
reports.Add(new WeeklyReport2());
reports.Add(new WeeklyReport3());
<snip>
foreach (ReportClass report in reports)
{
report.ExportToDisk(ExportFormatType.PortableDocFormat, @"c:\reports\" + report.ResourceName + ".pdf");
}
Это предоставило бы мне папку, полную отчетов, но я хотел бы отправить всем по электронной почте один PDF-файл со всеми еженедельными отчетами.Поэтому мне нужно их объединить.
Есть ли простой способ сделать это без установки каких-либо дополнительных сторонних элементов управления?У меня уже есть DevExpress и CrystalReports, и я бы предпочел не добавлять слишком много новых.
Было бы лучше объединить их в цикле foreach или в отдельном цикле?(или альтернативный способ)
Спасибо
Решение
Мне пришлось решить аналогичную проблему, и в итоге я создал небольшую утилиту pdfmerge, которая использует PDFsharp ( PDFsharp ) проект, который, по сути, лицензирован MIT.
Код предельно прост, мне нужна была утилита cmdline, поэтому у меня больше кода, предназначенного для разбора аргументов, чем для объединения PDF-файлов:
using (PdfDocument one = PdfReader.Open("file1.pdf", PdfDocumentOpenMode.Import))
using (PdfDocument two = PdfReader.Open("file2.pdf", PdfDocumentOpenMode.Import))
using (PdfDocument outPdf = new PdfDocument())
{
CopyPages(one, outPdf);
CopyPages(two, outPdf);
outPdf.Save("file1and2.pdf");
}
void CopyPages(PdfDocument from, PdfDocument to)
{
for (int i = 0; i < from.PageCount; i++)
{
to.AddPage(from.Pages[i]);
}
}
Другие советы
Вот единственная функция, которая объединит X количество PDF-файлов с помощью PDFsharp
public static void MergePDFs(string targetPath, params string[] pdfs) {
using(PdfDocument targetDoc = new PdfDocument()){
foreach (string pdf in pdfs) {
using (PdfDocument pdfDoc = PdfReader.Open(pdf, PdfDocumentOpenMode.Import)) {
for (int i = 0; i < pdfDoc.PageCount; i++) {
targetDoc.AddPage(pdfDoc.Pages[i]);
}
}
}
targetDoc.Save(targetPath);
}
}
PDFsharp ( PDFsharp ) кажется, это позволяет объединить несколько PDF-документов в один.
И то же самое также возможно с iTextSharp.
Я использовал iTextSharp с c # для объединения PDF-файлов.Это код, который я использовал.
string[] lstFiles=new string[3];
lstFiles[0]=@"C:/pdf/1.pdf";
lstFiles[1]=@"C:/pdf/2.pdf";
lstFiles[2]=@"C:/pdf/3.pdf";
PdfReader reader = null;
Document sourceDocument = null;
PdfCopy pdfCopyProvider = null;
PdfImportedPage importedPage;
string outputPdfPath=@"C:/pdf/new.pdf";
sourceDocument = new Document();
pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream(outputPdfPath, System.IO.FileMode.Create));
//Open the output file
sourceDocument.Open();
try
{
//Loop through the files list
for (int f = 0; f < lstFiles.Length-1; f++)
{
int pages =get_pageCcount(lstFiles[f]);
reader = new PdfReader(lstFiles[f]);
//Add pages of current file
for (int i = 1; i <= pages; i++)
{
importedPage = pdfCopyProvider.GetImportedPage(reader, i);
pdfCopyProvider.AddPage(importedPage);
}
reader.Close();
}
//At the end save the output file
sourceDocument.Close();
}
catch (Exception ex)
{
throw ex;
}
private int get_pageCcount(string file)
{
using (StreamReader sr = new StreamReader(File.OpenRead(file)))
{
Regex regex = new Regex(@"/Type\s*/Page[^s]");
MatchCollection matches = regex.Matches(sr.ReadToEnd());
return matches.Count;
}
}
Это то, что я выяснил и хотел поделиться с вами.
public static byte[] MergePdf(List<byte[]> pdfs)
{
List<PdfSharp.Pdf.PdfDocument> lstDocuments = new List<PdfSharp.Pdf.PdfDocument>();
foreach (var pdf in pdfs)
{
lstDocuments.Add(PdfReader.Open(new MemoryStream(pdf), PdfDocumentOpenMode.Import));
}
using (PdfSharp.Pdf.PdfDocument outPdf = new PdfSharp.Pdf.PdfDocument())
{
for(int i = 1; i<= lstDocuments.Count; i++)
{
foreach(PdfSharp.Pdf.PdfPage page in lstDocuments[i-1].Pages)
{
outPdf.AddPage(page);
}
}
MemoryStream stream = new MemoryStream();
outPdf.Save(stream, false);
byte[] bytes = stream.ToArray();
return bytes;
}
}
Здесь уже есть несколько хороших ответов, но я подумал, что мог бы упомянуть об этом pdftk может быть полезно для этой задачи.Вместо того чтобы создавать один PDF-файл напрямую, вы могли бы создать каждый нужный вам PDF-файл, а затем объединить их вместе в качестве постобработки с помощью pdftk.Это можно даже сделать из вашей программы, используя вызов system() или ShellExecute().
Вот ссылка на пример использования PDFsharp и объединенные документы
Я знаю, что многие люди рекомендовали PDF Sharp, однако не похоже, что этот проект обновлялся с июня 2008 года.Кроме того, исходный код недоступен.
Лично я играл с iTextSharp, с которым было довольно легко работать.
Объединение двух byte[]
использование iTextSharp вплоть до версии 5.x:
internal static MemoryStream mergePdfs(byte[] pdf1, byte[] pdf2)
{
MemoryStream outStream = new MemoryStream();
using (Document document = new Document())
using (PdfCopy copy = new PdfCopy(document, outStream))
{
document.Open();
copy.AddDocument(new PdfReader(pdf1));
copy.AddDocument(new PdfReader(pdf2));
}
return outStream;
}
Вместо того, чтобы byte[]
это тоже можно передать Stream
's
Я объединил два вышеприведенных варианта, потому что мне нужно было объединить 3 pdfbytes и вернуть байт
internal static byte[] mergePdfs(byte[] pdf1, byte[] pdf2,byte[] pdf3)
{
MemoryStream outStream = new MemoryStream();
using (Document document = new Document())
using (PdfCopy copy = new PdfCopy(document, outStream))
{
document.Open();
copy.AddDocument(new PdfReader(pdf1));
copy.AddDocument(new PdfReader(pdf2));
copy.AddDocument(new PdfReader(pdf3));
}
return outStream.ToArray();
}
Вот решение http://www.wacdesigns.com/2008/10/03/merge-pdf-files-using-c В нем используется бесплатная библиотека iTextSharp с открытым исходным кодом http://sourceforge.net/projects/itextsharp
Я сделал это с помощью PDFBox.Я полагаю, это работает аналогично iTextSharp.
Ты мог бы попробовать pdf-перемешиватель gtk-apps.org
Следующий метод получает List
из byte
массив, который является PDF byte
массив, а затем возвращает byte
массив.
using ...;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
public static class PdfHelper
{
public static byte[] PdfConcat(List<byte[]> lstPdfBytes)
{
byte[] res;
using (var outPdf = new PdfDocument())
{
foreach (var pdf in lstPdfBytes)
{
using (var pdfStream = new MemoryStream(pdf))
using (var pdfDoc = PdfReader.Open(pdfStream, PdfDocumentOpenMode.Import))
for (var i = 0; i < pdfDoc.PageCount; i++)
outPdf.AddPage(pdfDoc.Pages[i]);
}
using (var memoryStreamOut = new MemoryStream())
{
outPdf.Save(memoryStreamOut, false);
res = Stream2Bytes(memoryStreamOut);
}
}
return res;
}
public static void DownloadAsPdfFile(string fileName, byte[] content)
{
var ms = new MemoryStream(content);
HttpContext.Current.Response.Clear();
HttpContext.Current.Response.ContentType = "application/pdf";
HttpContext.Current.Response.AddHeader("content-disposition", $"attachment;filename={fileName}.pdf");
HttpContext.Current.Response.Buffer = true;
ms.WriteTo(HttpContext.Current.Response.OutputStream);
HttpContext.Current.Response.End();
}
private static byte[] Stream2Bytes(Stream input)
{
var buffer = new byte[input.Length];
using (var ms = new MemoryStream())
{
int read;
while ((read = input.Read(buffer, 0, buffer.Length)) > 0)
ms.Write(buffer, 0, read);
return ms.ToArray();
}
}
}
Итак, в результате PdfHelper.PdfConcat
метод передается в PdfHelper.DownloadAsPdfFile
способ.
PS:A NuGet
пакет с именем [PdfSharp][1]
необходимо установить.Так что в Package Manage Console
тип окна:
Установочный пакет PDFsharp
Вот пример использования iTextSharp
public static void MergePdf(Stream outputPdfStream, IEnumerable<string> pdfFilePaths)
{
using (var document = new Document())
using (var pdfCopy = new PdfCopy(document, outputPdfStream))
{
pdfCopy.CloseStream = false;
try
{
document.Open();
foreach (var pdfFilePath in pdfFilePaths)
{
using (var pdfReader = new PdfReader(pdfFilePath))
{
pdfCopy.AddDocument(pdfReader);
pdfReader.Close();
}
}
}
finally
{
document?.Close();
}
}
}
Конструктор PdfReader имеет много перегрузок.Можно заменить тип параметра IEnumerable<string>
с IEnumerable<Stream>
и это тоже должно сработать.Пожалуйста, обратите внимание, что метод не закрывает OutputStream, он делегирует эту задачу создателю потока.
Следующий метод объединяет два PDF-файла (f1 и f2) с помощью iTextSharp.Второй PDF-файл добавляется после определенного индекса f1.
string f1 = "D:\\a.pdf";
string f2 = "D:\\Iso.pdf";
string outfile = "D:\\c.pdf";
appendPagesFromPdf(f1, f2, outfile, 3);
public static void appendPagesFromPdf(String f1,string f2, String destinationFile, int startingindex)
{
PdfReader p1 = new PdfReader(f1);
PdfReader p2 = new PdfReader(f2);
int l1 = p1.NumberOfPages, l2 = p2.NumberOfPages;
//Create our destination file
using (FileStream fs = new FileStream(destinationFile, FileMode.Create, FileAccess.Write, FileShare.None))
{
Document doc = new Document();
PdfWriter w = PdfWriter.GetInstance(doc, fs);
doc.Open();
for (int page = 1; page <= startingindex; page++)
{
doc.NewPage();
w.DirectContent.AddTemplate(w.GetImportedPage(p1, page), 0, 0);
//Used to pull individual pages from our source
}// copied pages from first pdf till startingIndex
for (int i = 1; i <= l2;i++)
{
doc.NewPage();
w.DirectContent.AddTemplate(w.GetImportedPage(p2, i), 0, 0);
}// merges second pdf after startingIndex
for (int i = startingindex+1; i <= l1;i++)
{
doc.NewPage();
w.DirectContent.AddTemplate(w.GetImportedPage(p1, i), 0, 0);
}// continuing from where we left in pdf1
doc.Close();
p1.Close();
p2.Close();
}
}
Чтобы решить аналогичную проблему, я использовал iTextSharp следующим образом:
//Create the document which will contain the combined PDF's
Document document = new Document();
//Create a writer for de document
PdfCopy writer = new PdfCopy(document, new FileStream(OutPutFilePath, FileMode.Create));
if (writer == null)
{
return;
}
//Open the document
document.Open();
//Get the files you want to combine
string[] filePaths = Directory.GetFiles(DirectoryPathWhereYouHaveYourFiles);
foreach (string filePath in filePaths)
{
//Read the PDF file
using (PdfReader reader = new PdfReader(vls_FilePath))
{
//Add the file to the combined one
writer.AddDocument(reader);
}
}
//Finally close the document and writer
writer.Close();
document.Close();