Question

J'essaie d'analyser le DOM XHTML avec JTidy, et cette tâche semble plutôt contre-intuitive. En particulier, il existe une méthode pour analyser HTML:

Node Tidy.parse(Reader, Writer)

Et pour obtenir le < corps / > de ce nœud, je suppose, je devrais utiliser

Node Node.findBody(TagTable)

Où devrais-je me procurer une instance de ce TagTable? (Le constructeur est protégé et je n’ai pas trouvé d’usine pour le produire.)

J'utilise JTidy 8.0-SNAPSHOT.

Était-ce utile?

La solution

J'ai trouvé qu'il y a beaucoup de méthode plus simple pour extraire le corps:

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

Puis utilisez nettoie la paire lecteur / graveur.

Simple comme il se doit.

Autres conseils

Vous pouvez utiliser la méthode parseDOM à la place, ce qui vous donnerait un org.w3c.dom.Document back:

.
Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top