¿Cómo analizar (no bien formado) HTML en Android?
Pregunta
¿Cómo analizar HTML no bien formado en Android?
Intenté usar XOM y TagSoup, pero me aparece el siguiente error al crear el Generador:
11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.
¿Debo instalar Xerces para usar XOM o puedo usar tagsoup sin XOM?
Solución
Puede encontrar JTidy ( http://jtidy.sourceforge.net/ ) - un puerto de HTMLTidy para ser lo suficientemente ligero. Da salida a XHTML a petición
Otros consejos
XOM puede requerir que Xerces esté en la ruta de clase, puede depender de la versión de Java. Actualmente utilizamos
xercesImpl-2.8.0.jar
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow