Androidで(整形式でない)HTMLを解析する方法は?
質問
Androidで整形式でないHTMLを解析する方法
XOMとTagSoupを使用しようとしましたが、ビルダーの作成時に次のエラーが表示されます:
11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.
XercesをインストールしてXOMを使用する必要がありますか、またはXOMなしでtagsoupを使用できますか?
解決
JTidy( http://jtidy.sourceforge.net/ )-のポートを見つけるかもしれませんHTMLTidyが十分に軽量であること。要求に応じてXHTMLを出力します
他のヒント
XOMでは、クラスパスにXercesが必要な場合があります-Javaのバージョンに依存する場合があります。現在
を使用していますxercesImpl-2.8.0.jar
所属していません StackOverflow