文字列でhtmlsourceからdivコンテンツを抽出(Java)
質問
iは、htmlソースを含む文字列から特別なdivタグ(クラス名で定義)のコンテンツを抽出しようとしています。 Javaの正規表現機能はperlほど使いやすいとは思いませんか?
以前にこれをやったことがありますか?コードを教えてもらえますか?おそらくdom-browsingは良い解決策かもしれませんが、私の問題に合ったチュートリアルは見つかりませんでした。
解決
コメントに基づくと、一般的なケース(「クローラー」)があり、XMLファイルを効果的に解析しているようです。ソースページがxhtmlの場合、さまざまなXMLライブラリにさまざまなオプションがあります。 (たとえば、JDom)。
所属していません StackOverflow