Domanda

Devo confrontare i documenti PDF che è stato creato con testo.In realtà sono riuscito a confrontare i documenti, ma sto ingndolando su una piccola differenza.

Quando si apre i PDF in un editor come Blocco note ++ posso vedere che c'è qualcosa come questo towares la fine del file:

/Root 1 0 R
/ID [<Some ID here> <Some other ID here>]
.

Come ho scoperto qui ( Qual è l'IDcampo in un file PDF? ) Questo elemento appartiene a qualcosa chiamato "Trailer".

Posso accedere e modificare questo "campo" con Apache PDFbox?

È stato utile?

Soluzione

Il seguente snippet funziona bene per me.

PDDocument doc = PDDocument.load(pdf);
COSArray cosArray = doc.getDocument().getDocumentID();
// Clear or set whatever values...
cosArray.clear();
doc.getDocument().setDocumentID(cosArray);
.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top