質問

(私が質問をいと思うした対応私の特定のニーズが...)

知りたいと思い場合がありJavaアプリケーション解析のための実世界(読み:完成形)HTML.解析により、平均ようなもの:

  • コーヒーに飽きたら寿司に入る最も著名な色のドキュメントを編集するには、チャンク
  • 変化する色のその他のカラー(このため、サポートしている変更のHTML)
  • 枝打ち出し不要なタグ
  • 固定のHTMLを形HTMLのスニペット

パーツを行っている図書館などのジェリコ、jTidy.'Plugins'ッることがあります。

感謝。

役に立ちましたか?

解決

あなたはTagSoupをチェックアウトする場合があります:

http://home.ccil.org/~cowan/XML/tagsoup/

他のヒント

さて私は、XSLTを使用して、有効なXMLに最初にそれを片付けるだろうが、私が最も目立つ色/何でもあなたが必要とする処理/剪定どうなる条件深いコピーを行います。

JTidy, Javaポート HTMLテ.とによっては、どのオプションを選択し、非形式HTMLおよびその他クリーンです。

る必要がありましたかを、色を変えます。

たぶん、あなたはこのリストの中に何かを見つけるでしょう(TagSoup、NekoHTMLを試してみてください、VietSpider HTMLParser)。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top