我正在尝试从包含html源的字符串中提取特殊div-tag(由其类名定义)的内容。我认为Java的regexp特性并不像perl那样容易使用,对吧?

之前是否有人这样做过,可以给我一段代码?也许dom-browse是一个很好的解决方案,但我没有找到任何与我的问题相匹配的教程。

有帮助吗?

解决方案

根据您的评论,听起来您有一般情况(“抓取工具”),因此您可以有效地解析XML文件。如果源页面是xhtml,那么各种XML库中有多种选项。 (例如,JDom)。

其他提示

您可以使用 HTML Parser 或其他一些HTML解析库列表

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top