Domanda

Ho giocato con iText per provare a ottenere un elenco di caratteri incorporati utilizzati in un PDF esterno. Mi sto perdendo qualcosa o questo non è ben documentato? Qualcuno potrebbe spiegarmelo o suggerire un'alternativa? Preferibile i nomi dei caratteri e tutti i dati associati.

È stato utile?

Soluzione

Cosa hai provato? I caratteri vengono generalmente catturati nel dizionario associato a ciascuna pagina, quindi se prendi il dizionario delle pagine, cerca un sotto-dizionario per il carattere, ecc ... lo troverai.

Se hai l'ultima versione di iText (HEAD da SVN), dai un'occhiata al parser di testo. C'è uno strumento lì dentro che, oltre a scaricare il testo sulla pagina, scarica anche la struttura del dizionario, comprese le informazioni sui caratteri.

Se la discussione su 'dizionario', ecc ... non è chiara, probabilmente dovrai iniziare con almeno una breve lettura delle specifiche PDF (Adobe ce l'ha sul loro sito). Probabilmente non troverai un metodo in iText per ottenere i caratteri da una pagina, ma puoi ottenere i dizionari e, in PDF, il dizionario definisce tutto (compresi i caratteri)

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top