Как разобрать (не правильно сформированный) HTML в Android?

StackOverflow https://stackoverflow.com/questions/1805869

  •  05-07-2019
  •  | 
  •  

Вопрос

Как разобрать не правильно сформированный HTML в Android?

Я пытался использовать XOM и TagSoup, но я получаю следующую ошибку при создании Builder:

11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.

Должен ли я установить Xerces для использования XOM или я могу использовать tagoup без XOM?

Это было полезно?

Решение

Вы можете найти JTidy ( http://jtidy.sourceforge.net/ ) - порт HTMLTidy должен быть достаточно легким. Он выводит XHTML по запросу

Другие советы

XOM может потребовать, чтобы Xerces находился в пути к классам - это может зависеть от версии Java. В настоящее время мы используем

xercesImpl-2.8.0.jar
Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top