文字列でhtmlsourceからdivコンテンツを抽出（Java）

質問

iは、htmlソースを含む文字列から特別なdivタグ（クラス名で定義）のコンテンツを抽出しようとしています。 Javaの正規表現機能はperlほど使いやすいとは思いませんか？

以前にこれをやったことがありますか？コードを教えてもらえますか？おそらくdom-browsingは良い解決策かもしれませんが、私の問題に合ったチュートリアルは見つかりませんでした。

解決

コメントに基づくと、一般的なケース（「クローラー」）があり、XMLファイルを効果的に解析しているようです。ソースページがxhtmlの場合、さまざまなXMLライブラリにさまざまなオプションがあります。（たとえば、JDom）。

他のヒント

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow