Документация JTIDY и TAGSOUP
-
10-10-2019 - |
Вопрос
Я ищу документацию (официально документация, если это возможно) для библиотек Tagsoup и Jtidy.
Я хочу использовать эти библиотеки, чтобы манипулировать файлами HTML «Tagsoup», которые включают в себя теги XML с различными пространствами имен, смешанными между тегами HTML (HTML, XHTML или HTML5).
Я тестировал HTMLCleaner, Nekohtml и Jericho, но я не нахожу документацию для Jtidy и Tagsoup, кроме простых примеров для очистки файла.
Мне нужна документация о манипулировании содержимого, замены тегов, извлечения информации и т. Д.
Спасибо
Примечание. После тестирования всех вариантов я использовал Стакс / Вудстокс :
Решение
Ответ на аналогичный вопрос в группе Google Friends Tagsoup может помочь:
Вы, наверное, уже видели их, но здесь доступен Javadoc для Jtidy: http://jtidy.sourceforge.net/apidocs/index.html