JTidy Node.findBody（）＆＃8212;如何使用？

题

我正在尝试使用JTidy进行XHTML DOM解析，这似乎是违反直觉的任务。特别是，有一种解析HTML的方法：

Node Tidy.parse(Reader, Writer)

并获得＆lt; body /＆gt;我假设该节点应该使用

Node Node.findBody(TagTable)

我应该在哪里获得该TagTable的实例？（构造函数受到保护，我还没有找到工厂来生产它。）

我使用JTidy 8.0-SNAPSHOT。

解决方案

我发现提取身体的很多更简单的方法：

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

然后在Reader-Writer对上使用整洁。

应该很简单。

其他提示

您可以使用 parseDOM 方法，这将为您提供 org.w3c.dom.Document ：

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);

许可以下： CC-BY-SA 和归因