Pergunta

Possível duplicata:
Ferramenta para comparar um grande número de arquivos PDF?

Estou no cenário clássico em que o negócio lhe dá um monte de novo Formulários PDF para o Ano Novo sem notas de revisão e você deve descobrir o que é diferente dos do ano anterior.

Estou falando de muitas formas aqui, por isso estou tentando encontrar uma maneira de comparar PDFs para delinear as diferenças sem que as pessoas passem manualmente por cada um deles.

Minha idéia era extrair todo o texto dos PDFs e despejá -lo em um .txt e executar diferenças nos arquivos de texto, mas parece horrível.

Minha pergunta diz programaticamente, mas eu ficaria feliz com qualquer ferramenta confiável para comparar PDFs e principalmente buscar uma idéia das experiências das pessoas. Também disposto a entreter quaisquer soluções programáticas (de preferência em C#, mas por favor tire o tiro algum Ideias).

Foi útil?

Solução

Existem alguns produtos de software que afirmam PDFs diff. Eu nunca precisei usar um, mas se esse for um processo recorrente, acho que seria sábio para sua empresa investir em um deles. Basta pesquisar no Google "PDF Diff" para um monte de aplicativos em potencial.

Além disso, sua situação é muito semelhante a esta pergunta: Ferramenta para comparar um grande número de arquivos PDF? Eu acho que sua discussão pode ajudar.

Outras dicas

Eu sou um desenvolvedor de Biblioteca Docótico.pdf. Utilizamos a comparação de PDF em testes de unidade para verificar esse teste produz PDF conforme o esperado. O PDF é uma coleção de objetos especiais e comparamos todos os objetos PDF, ignorando algumas propriedades, como IDs de reboque e informações do criador. Esta implementação funciona bem.

Você pode tentar o método Pdfdocument.documentSeeeQual. Este método apenas informa que você é documentos iguais, sem diferenças específicas. Você pode entrar em contato conosco se precisar de mais funcionalidade.

Fiz a abordagem para obter os dados brutos do PDF, depois usar o Word ou Tortissevn, ou Winmerge, etc ... para cuidar da peça de comparação. No meu caso, fiz a comparação em um RichTextBox em C#... colorindo as diferenças, etc ... Como queríamos tudo em nosso aplicativo.

Aqui está o que eu fiz ...Comparação em PDF Enquanto eu estava tentando comparar documentos mistos, o Word e o PDF.

No entanto, eu recomendaria o PDFBox para a análise, um pouco mais elegante ... embora o itextSharp tenha funcionado ok ...

Eu escrevi um blog sugerindo algumas abordagens para comparar arquivos PDF em https://blog.idrsolutions.com/2010/09/comparing-2-pdf-files/

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top