如何在android中解析格式不正确的HTML?

我尝试使用XOM和TagSoup,但在创建Builder时出现以下错误:

11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.

我必须安装Xerces才能使用XOM,或者我可以使用不带XOM的tagsoup吗?

有帮助吗?

解决方案

你可能会发现JTidy( http://jtidy.sourceforge.net/ ) - 一个端口HTMLTidy足够轻量级。它根据请求输出XHTML

其他提示

XOM可能要求Xerces位于类路径中 - 它可能取决于Java的版本。目前我们使用

xercesImpl-2.8.0.jar
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top