documentation JTidy et TagSoup
-
10-10-2019 - |
Question
Je suis à la recherche de la documentation (officiellement documentation si elle est possible) pour les bibliothèques tagsoup et JTidy.
Je veux utiliser ces bibliothèques pour manipuler les fichiers "tagsoup" html qui incluent des balises XML avec différents espaces de noms mélangés entre html (html, xhtml ou html5) tags.
Je l'ai testé HTMLCleaner, NekoHTML et Jericho, mais je ne trouve pas de documentation pour JTidy et TagSoup, en dehors des exemples les plus simples pour effacer un fichier.
J'ai besoin de manipuler la documentation sur le contenu, remplacer les étiquettes, les informations d'extraction, etc ...
Merci
Note: Après le test de toutes les options, je Stax / Woodstox :
La solution
La réponse à une question similaire sur les tagsoup Amis groupe Google peut aider:
Vous avez probablement déjà vu, mais la javadoc pour JTidy est disponible ici: http: / /jtidy.sourceforge.net/apidocs/index.html