Frage

Ich versuche, mit jtidy XHTML DOM Parsen zu tun, und es scheint eher eingängig Aufgabe. Insbesondere ist es eine Methode, HTML zu analysieren:

Node Tidy.parse(Reader, Writer)

Und um die dieser Knoten, nehme ich an, soll ich verwenden

Node Node.findBody(TagTable)

Wo soll ich eine Instanz dieser TagTable bekommen? (Constructor ist geschützt, und ich habe nicht eine Fabrik zu produzieren es. Gefunden)

Ich benutze jtidy 8.0-SNAPSHOT.

War es hilfreich?

Lösung

Ich fand es viel einfachere Methode, den Körper zu extrahieren:

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

Und dann ordentlich zur Verwendung auf dem Reader-Writer-Paar.

So einfach wie es sein sollte.

Andere Tipps

Sie könnten die parseDOM Methode stattdessen verwenden, die Sie würde eine org.w3c.dom.Document zurück:

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top