Загрузка ответа из WebResponse - Изображения включены?
-
27-10-2019 - |
Вопрос
Я пытаюсь скачать HTML, чтобы проанализировать его, используя минимальную пропускную способность для загрузки. Это немного моего кода.
if (!String.IsNullOrEmpty(siteAddress))
webReq = WebRequest.Create(siteAddress)
WebResponse webRes = webReq.GetResponse();
Stream streamResponse = webRes.GetResponseStream();
StreamReader streamRead = new StreamReader(streamResponse);
StringReader sr = new StringReader(streamRead.ReadToEnd().Trim());
streamResponse.Close();
streamRead.Close();
webRes.Close();
HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
hDoc.Load(sr);
Может ли кто -нибудь подтвердить, что извлечение ответа только обеспечивает текстовый ответ, а изображения также не загружаются? Как насчет загрузки его методом HTMLagilityPack?
Решение
Когда используешь WebClient
, WebRequest
или же HtmlAgilityPack
это только HTML Вы будете скачать.
Если вам нужны изображения (или другие ресурсы), вы должны искать URL -адреса изображения в загруженном документе, и запросы выпускают себя.
Если вы хотите немного поэкспериментировать, WebBrowser
Контроль может быть чем -то, на что можно посмотреть. Из этого вы можете взять Document
собственность и посмотрите на его собственность Images
и скачать все изображения самостоятельно.
Что ты хочешь делать?
Другие советы
Вы загружаете HTML -источник сайта, а не весь сайт. Это большая разница.
Посмотрите, как использовать HTML Agility Pack а также Вот этот