Вопрос

После работы с .NET HttpWebRequest/Response объекты, я лучше застрелюсь, чем буду использовать это для сканирования веб-сайтов.Я ищу существующую библиотеку .NET, которая может получать URL-адреса и давать вам возможность переходить по ссылкам, извлекать/заполнять/отправлять формы на странице и т. д.Перл LWP и WWW::Mechanize модули делают это очень хорошо, но я работаю над проектом .NET.

Я столкнулся с Пакет гибкости HTML, который выглядит потрясающе, но не позволяет имитировать ссылки/формы.

Существует ли такой инструмент уже?

Это было полезно?

Решение

Кто-то написал небольшой код для запуска в качестве дополнения к пакету HTML Agility Pack (который мне тоже нравится), который позволяет вам немного поработать с формами:

http://apps.ultravioletconsulting.com/projects/uvcwebtransform/docs/class_html_agility_pack_1_1_add_ons_1_1_form_processor_1_1_form_processor.html

Я прочитал обзор, в котором говорится, что это не WWW::Mechanize, но это отличное начало.Код предоставлен, поэтому вы можете легко его расширить.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top