jtidy和tagsoup文档
-
10-10-2019 - |
题
我正在寻找标签和jtidy库的文档(如果可能的话,可以正式文档)。
我想使用此库来操纵HTML“ TAGSOUP”文件,其中包括XML标签,其中与HTML(HTML,XHTML或HTML5)标签混合了不同的名称空间。
我已经测试了HTMLCleaner,Nekohtml和Jericho,但是除了最简单的示例以清除文件外,我没有找到Jtidy和Tagsoup的文档。
我需要有关操纵内容,替换标签,提取信息等的文档。
谢谢
注意:测试所有选项后,我使用了 Stax / 伍德斯托克斯 :
解决方案
在TagSoup-Fiends Google组上的类似问题的答案可能会有所帮助:
您可能已经看过它们了,但是Jtidy的Javadoc在这里可用: http://jtidy.sourceforge.net/apidocs/index.html
不隶属于 StackOverflow