Domanda

Sto cercando la documentazione (ufficialmente la documentazione se è possibile) per le librerie TagSoup e jTidy.

Voglio usare questo librerie per manipolare i file HTML "tagsoup" che includono i tag XML con spazi dei nomi diversi mescolati tra html (HTML, XHTML o HTML5) tag.

Ho testato HTMLCleaner, NekoHTML e Gerico, ma non trovo la documentazione per jTidy e TagSoup, oltre a esempi più semplici per cancellare un file.

Ho bisogno di documentazione su manipolare contenuti, sostituire i tag, informazioni estratto, ecc ...

Grazie

Nota: Dopo la prova tutte le opzioni, ho usato StAX / Woodstox :

È stato utile?

Soluzione

La risposta a una domanda simile sui tagsoup-amici google gruppo può aiutare:

Documentazione per TagSoup

Probabilmente avete già visti, ma il javadoc per JTidy è disponibile qui: http: / /jtidy.sourceforge.net/apidocs/index.html

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top