Question

Je suis à la recherche de la documentation (officiellement documentation si elle est possible) pour les bibliothèques tagsoup et JTidy.

Je veux utiliser ces bibliothèques pour manipuler les fichiers "tagsoup" html qui incluent des balises XML avec différents espaces de noms mélangés entre html (html, xhtml ou html5) tags.

Je l'ai testé HTMLCleaner, NekoHTML et Jericho, mais je ne trouve pas de documentation pour JTidy et TagSoup, en dehors des exemples les plus simples pour effacer un fichier.

J'ai besoin de manipuler la documentation sur le contenu, remplacer les étiquettes, les informations d'extraction, etc ...

Merci

Note: Après le test de toutes les options, je Stax / Woodstox :

Était-ce utile?

La solution

La réponse à une question similaire sur les tagsoup Amis groupe Google peut aider:

Documentation pour TagSoup

Vous avez probablement déjà vu, mais la javadoc pour JTidy est disponible ici: http: / /jtidy.sourceforge.net/apidocs/index.html

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top