Какие библиотеки для синтаксического анализа HTML вы рекомендуете в Java [закрыто]

StackOverflow https://stackoverflow.com/questions/26638

Вопрос

Я хочу разобрать некоторый HTML-код, чтобы найти значения некоторых атрибутов / тегов и т.д.

Какие парсеры HTML вы рекомендуете?Есть какие-нибудь плюсы и минусы?

Это было полезно?

Решение

NekoHTML, Набор тегов, и Аккуратный это позволит вам анализировать HTML, а затем обрабатывать с помощью XML-инструментов, таких как XPath.

Другие советы

Я пытался Анализатор HTML что до смерти просто.

Вам нужно выполнить полный синтаксический анализ HTML-кода?Если вы просто ищете определенные значения в содержимом (определенный тег / параметр), то простого регулярного выражения может быть достаточно, и оно вполне может быть быстрее.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top