質問

いくつかの属性/タグなどの値を見つけるために、HTMLを解析したいと考えています。

どの HTML パーサーをお勧めしますか?長所と短所はありますか?

役に立ちましたか?

解決

ネコHTML, タグスープ, 、 そして JTidy HTML を解析し、XPath などの XML ツールで処理できるようになります。

他のヒント

私が試してみました HTMLパーサー それはとてもシンプルです。

HTML を完全に解析する必要がありますか?コンテンツ (特定のタグ/パラメーター) 内の特定の値を探しているだけの場合は、単純な正規表現で十分であり、より高速になる可能性があります。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top