Como analisar (não bem formado) HTML no android?
Pergunta
Como analisar formou-well HTML não no android?
Eu tentei usar XOM e TagSoup, mas eu recebo o seguinte erro ao criar o Builder:
11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.
Deve i instalar Xerces usar XOM ou eu posso usar TagSoup sem XOM?
Solução
Você pode achar JTidy ( http://jtidy.sourceforge.net/ ) - um porto de HTMLTidy ser suficientemente leve. Ele produz XHTML a pedido
Outras dicas
XOM pode exigir Xerces para estar no classpath - pode depender da versão do Java. Atualmente nós usamos
xercesImpl-2.8.0.jar
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow