Документация JTIDY и TAGSOUP

https://stackoverflow.com/questions/4452566

10-10-2019
|

Вопрос

Я ищу документацию (официально документация, если это возможно) для библиотек Tagsoup и Jtidy.

Я хочу использовать эти библиотеки, чтобы манипулировать файлами HTML «Tagsoup», которые включают в себя теги XML с различными пространствами имен, смешанными между тегами HTML (HTML, XHTML или HTML5).

Я тестировал HTMLCleaner, Nekohtml и Jericho, но я не нахожу документацию для Jtidy и Tagsoup, кроме простых примеров для очистки файла.

Мне нужна документация о манипулировании содержимого, замены тегов, извлечения информации и т. Д.

Спасибо

Примечание. После тестирования всех вариантов я использовал Стакс / Вудстокс :

Решение

Ответ на аналогичный вопрос в группе Google Friends Tagsoup может помочь:

Документация для тегов

Вы, наверное, уже видели их, но здесь доступен Javadoc для Jtidy: http://jtidy.sourceforge.net/apidocs/index.html

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow