Comment analyser HTML (non bien formé) dans Android?
Question
Comment analyser du code HTML non formé dans Android?
J'ai essayé d'utiliser XOM et TagSoup, mais le message d'erreur suivant s'affiche lors de la création du générateur:
11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.
Dois-je installer Xerces pour utiliser XOM ou puis-je utiliser tagsoup sans XOM?
La solution
Vous pouvez trouver JTidy ( http://jtidy.sourceforge.net/ ) - un port de HTMLTidy pour être suffisamment léger. Il sort XHTML sur demande
Autres conseils
XOM peut nécessiter que Xerces soit dans le chemin de classe - cela peut dépendre de la version de Java. Actuellement, nous utilisons
xercesImpl-2.8.0.jar
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow