Pergunta

Eu estou tentando fazer XHTML DOM analisar com JTidy, e parece ser tarefa bastante intuitivo. Em particular, não há um método para analisar HTML:

Node Tidy.parse(Reader, Writer)

E para obter o desse nó, eu assumo, eu deveria usar

Node Node.findBody(TagTable)

Onde devo começar uma instância dessa TagTable? (Construtor é protegida, e eu não ter encontrado uma fábrica para produzi-lo.)

Eu uso JTidy 8.0-SNAPSHOT.

Foi útil?

Solução

Eu encontrei há muito método mais simples para extrair o corpo:

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

E, em seguida, usar arrumado no par de leitor-gravador.

Simples como deveria ser.

Outras dicas

Você pode usar o método parseDOM vez, o que lhe daria uma volta org.w3c.dom.Document:

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top