Какие библиотеки для синтаксического анализа HTML вы рекомендуете в Java [закрыто]
-
09-06-2019 - |
Вопрос
Я хочу разобрать некоторый HTML-код, чтобы найти значения некоторых атрибутов / тегов и т.д.
Какие парсеры HTML вы рекомендуете?Есть какие-нибудь плюсы и минусы?
Решение
NekoHTML, Набор тегов, и Аккуратный это позволит вам анализировать HTML, а затем обрабатывать с помощью XML-инструментов, таких как XPath.
Другие советы
Я пытался Анализатор HTML что до смерти просто.
Вам нужно выполнить полный синтаксический анализ HTML-кода?Если вы просто ищете определенные значения в содержимом (определенный тег / параметр), то простого регулярного выражения может быть достаточно, и оно вполне может быть быстрее.
Не связан с StackOverflow