题
(我已经看到类似的问题,但我认为他们没有满足我的特定需要,因此...)
我想知道如果有一个Java库,用于分析的真正的世界(阅读:不完整、虐待形成的)HTML。通过分析,我的意思是一样东西:
- 计算出的最突出的颜色在HTML块
- 改变颜色到一些其他颜色的(因此,必须支持修改HTML及)
- 修剪掉不必要的标记
- 固定了HTML,结果在形成HTML段
部分最后两个工作都是由图书馆如杰里科和jTidy."插件"这些将是巨大的。
在此先感谢!
解决方案
你可能想看看TagSoup:
不隶属于 StackOverflow