Вопрос

Я ищу документацию (официально документация, если это возможно) для библиотек Tagsoup и Jtidy.

Я хочу использовать эти библиотеки, чтобы манипулировать файлами HTML «Tagsoup», которые включают в себя теги XML с различными пространствами имен, смешанными между тегами HTML (HTML, XHTML или HTML5).

Я тестировал HTMLCleaner, Nekohtml и Jericho, но я не нахожу документацию для Jtidy и Tagsoup, кроме простых примеров для очистки файла.

Мне нужна документация о манипулировании содержимого, замены тегов, извлечения информации и т. Д.

Спасибо

Примечание. После тестирования всех вариантов я использовал Стакс / Вудстокс :

Это было полезно?

Решение

Ответ на аналогичный вопрос в группе Google Friends Tagsoup может помочь:

Документация для тегов

Вы, наверное, уже видели их, но здесь доступен Javadoc для Jtidy: http://jtidy.sourceforge.net/apidocs/index.html

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top