Надежный способ (программно) Сравнить PDF? [Дубликат

StackOverflow https://stackoverflow.com/questions/3834928

Вопрос

Возможный дубликат:
Инструмент для сравнения большого количества файлов PDF?

Я в классическом сценарии, где бизнес дает вам кучу новый PDF формы для нового года без ревизийных заметок, и вы должны выяснить, что отличается от предыдущих лет.

Я говорю здесь нагрузки форм здесь, поэтому я пытаюсь найти способ сравнить PDF, чтобы набросать различия, не имея людей вручную пройти через каждого и каждого из них.

Моя идея состояла в том, чтобы извлечь весь текст из PDFS и сбросить его в .txt, затем запустить различия в текстовых файлах, но это звучит ужасно.

Мой вопрос говорит программно, но я был бы доволен любыми надежными инструментами для сравнения PDFS, и в основном искать идею от опыта людей. Также готовы развлекать любые программные решения (желательно в C #, но пожалуйста, выселить Любые идеи).

Это было полезно?

Решение

Существует довольно много программных продуктов, которые претендуют на Diff PDF. Мне никогда не нужно было использовать один, но если это будет повторяющийся процесс, я думаю, что это будет мудро для вашей компании инвестировать в один из них. Просто Google "PDF diff" для кучка потенциальных приложений.

Кроме того, ваша ситуация очень похожа на этот вопрос: Инструмент для сравнения большого количества файлов PDF? Я думаю, что его обсуждение может помочь.

Другие советы

Я разработчик Docotic.pdf Библиотека. Отказ Мы используем сравнение PDF в модульных тестах для проверки того, что тест производит PDF, как и ожидалось. PDF - это коллекция специальных объектов, и мы сравниваем все объекты PDF, игнорируя некоторые свойства, такие как идентификаторы прицепа и информация о создании. Эта реализация работает нормально.

Вы можете попробовать метод Pdfdocument.documentareequal. Отказ Этот метод просто скажет вам документы, равные, без определенных различий. Вы можете связаться с нами, если вам нужна дополнительная функциональность.

Я пошел подход к получению необработанных данных из PDF, затем, используя слово или Tortesvnvn, или Winmerge и т. Д. ... Чтобы позаботиться о сравнении. В моем примере я сделал сравнение в RichtextBox в C # ... Окрашивая различия и т. Д. ... Поскольку мы хотели все в нашем приложении.

Вот что я сделал ...Сравнение PDF Как я пытался сравнить смешанные документы, слово и PDF.

Однако я бы порекомендовал PDFBox для расставания, немного более элегантный ... Хотя ItextSharp разработал хорошо ...

Я написал блог, предлагающий некоторые подходы для сравнения файлов PDF в https://blog.idrsolutions.com/2010/09/comparing-pdf-files/

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top