Frage

  

Mögliche Duplizieren:
  -Tool eine große Anzahl von PDF-Dateien vergleichen?

Ich bin im klassischen Szenario, in dem das Geschäft Ihnen ein Bündel gibt neue PDF-Formulare für das neue Jahr ohne Revision Notizen auch immer und Sie Figur sollen, was gegenüber dem Vorjahr diejenigen anders .

Ich spreche viele Formen hier, so dass ich einen Weg zu finden, ich versuche, PDFs zu outline Unterschiede zu vergleichen, ohne die Menschen, die manuell durch jeden zu gehen und jeden von ihnen.

war meine Idee, den gesamten Text aus dem PDF-Dateien zu extrahieren und Dump in eine .txt führen Sie Unterschiede auf Textdateien, aber es klingt schrecklich.

sagt Meine Frage programmatisch, aber ich würde mit allen zuverlässigen Tool gerne PDFs für den Vergleich und vor allem suchen, um eine Idee von Menschen Erfahrungen zu bekommen. Auch bereit, alle programmatischen Lösungen zu unterhalten (vorzugsweise in C #, aber pls schießen alle Ideen).

War es hilfreich?

Lösung

Es gibt eine ganze Reihe von Software-Produkten, die behaupten zu diff pdfs. Ich habe noch nie eine Notwendigkeit zu verwenden, hatte aber wenn dies ein wiederkehrender Prozess sein wird, ich glaube, es klug sein würde für Ihr Unternehmen in einer von ihnen zu investieren. Gerade Google „pdf diff“ für eine Reihe von Anwendungsmöglichkeiten.

Darüber hinaus ist Ihre Situation sehr ähnlich zu dieser Frage: -Tool eine große Anzahl vergleichen von PDF-Dateien? ich denke, die Diskussion helfen können.

Andere Tipps

Ich bin ein Entwickler von Docotic.Pdf Bibliothek . Wir verwenden PDF-Abgleich in Unit-Tests zur Überprüfung des Test PDF erzeugt, wie erwartet. PDF ist eine Sammlung von speziellen Objekten und wir vergleichen alle PDF-Objekte ignorieren einige Eigenschaften wie Anhänger IDs und Schöpfer Info. Diese Implementierung funktioniert.

Sie können versuchen, die Methode PdfDocument.DocumentsAreEqual . Diese Methode nur sagen, Sie sind Dokumente gleich, ohne spezifische Unterschiede. Sie können mit uns, wenn Sie mehr Funktionalität benötigen.

ging ich den Ansatz zu bekommen, die Rohdaten aus dem PDF, dann Verwendung von Word oder TortiseSVN machen oder WinMerge, etc ... Pflege des Vergleichs Stück zu nehmen. In meinem Fall habe ich den Vergleich in einem RichTextBox in C # ... Färben die Unterschiede, etc ... da wir alles in unseren App wollten.

Hier ist, was ich getan habe ... PDF Vergleich als ich versuchte, zu vergleichen gemischte Dokumente, Word und PDF.

Allerdings würde ich PDFBox für das Parsing empfehlen, ein bisschen mehr elegant ... obwohl iTextSharp arbeitet ok ...

Ich schrieb einen Blog einige Ansätze zum Vergleich von PDF-Dateien unter https://blog.idrsolutions.com/2010/09/comparing-2-pdf-files/

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top