質問

iは、htmlソースを含む文字列から特別なdivタグ(クラス名で定義)のコンテンツを抽出しようとしています。 Javaの正規表現機能はperlほど使いやすいとは思いませんか?

以前にこれをやったことがありますか?コードを教えてもらえますか?おそらくdom-browsingは良い解決策かもしれませんが、私の問題に合ったチュートリアルは見つかりませんでした。

役に立ちましたか?

解決

コメントに基づくと、一般的なケース(「クローラー」)があり、XMLファイルを効果的に解析しているようです。ソースページがxhtmlの場合、さまざまなXMLライブラリにさまざまなオプションがあります。 (たとえば、JDom)。

他のヒント

HTMLパーサーまたはこのリスト

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top