JTidy Node.findBody () & # 8212; ¿Cómo utilizar?

https://stackoverflow.com/questions/221277

03-07-2019
|

Pregunta

Estoy tratando de hacer XHTML DOM analizando con JTidy, y parece ser una tarea bastante contraintuitiva. En particular, hay un método para analizar HTML:

Node Tidy.parse(Reader, Writer)

Y para obtener < body / > de ese Nodo, supongo, debería usar

Node Node.findBody(TagTable)

¿Dónde debería obtener una instancia de esa TagTable? (El constructor está protegido y no he encontrado una fábrica para producirlo).

Uso JTidy 8.0-SNAPSHOT.

Solución

Encontré que hay mucho método más simple para extraer el cuerpo:

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

Y luego usa tidy en el par Reader-Writer.

Simple como debería ser.

Otros consejos

En su lugar, puede usar el método parseDOM , que le devolvería un org.w3c.dom.Document :

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow