我正在寻找标签和jtidy库的文档(如果可能的话,可以正式文档)。

我想使用此库来操纵HTML“ TAGSOUP”文件,其中包括XML标签,其中与HTML(HTML,XHTML或HTML5)标签混合了不同的名称空间。

我已经测试了HTMLCleaner,Nekohtml和Jericho,但是除了最简单的示例以清除文件外,我没有找到Jtidy和Tagsoup的文档。

我需要有关操纵内容,替换标签,提取信息等的文档。

谢谢

注意:测试所有选项后,我使用了 Stax / 伍德斯托克斯 :

有帮助吗?

解决方案

在TagSoup-Fiends Google组上的类似问题的答案可能会有所帮助:

标签的文档

您可能已经看过它们了,但是Jtidy的Javadoc在这里可用: http://jtidy.sourceforge.net/apidocs/index.html

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top