Pregunta

Estoy tratando de hacer XHTML DOM analizando con JTidy, y parece ser una tarea bastante contraintuitiva. En particular, hay un método para analizar HTML:

Node Tidy.parse(Reader, Writer)

Y para obtener < body / > de ese Nodo, supongo, debería usar

Node Node.findBody(TagTable)

¿Dónde debería obtener una instancia de esa TagTable? (El constructor está protegido y no he encontrado una fábrica para producirlo).

Uso JTidy 8.0-SNAPSHOT.

¿Fue útil?

Solución

Encontré que hay mucho método más simple para extraer el cuerpo:

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

Y luego usa tidy en el par Reader-Writer.

Simple como debería ser.

Otros consejos

En su lugar, puede usar el método parseDOM , que le devolvería un org.w3c.dom.Document :

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top