Вопрос

Я пытаюсь скачать HTML, чтобы проанализировать его, используя минимальную пропускную способность для загрузки. Это немного моего кода.

if (!String.IsNullOrEmpty(siteAddress))
                webReq = WebRequest.Create(siteAddress)

                WebResponse webRes = webReq.GetResponse();

                Stream streamResponse = webRes.GetResponseStream();
                StreamReader streamRead = new StreamReader(streamResponse);
                StringReader sr = new StringReader(streamRead.ReadToEnd().Trim());

                streamResponse.Close();
                streamRead.Close();    
                webRes.Close();

                HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
                hDoc.Load(sr);

Может ли кто -нибудь подтвердить, что извлечение ответа только обеспечивает текстовый ответ, а изображения также не загружаются? Как насчет загрузки его методом HTMLagilityPack?

Это было полезно?

Решение

Когда используешь WebClient, WebRequest или же HtmlAgilityPack это только HTML Вы будете скачать.

Если вам нужны изображения (или другие ресурсы), вы должны искать URL -адреса изображения в загруженном документе, и запросы выпускают себя.

Если вы хотите немного поэкспериментировать, WebBrowser Контроль может быть чем -то, на что можно посмотреть. Из этого вы можете взять Document собственность и посмотрите на его собственность Images и скачать все изображения самостоятельно.

Что ты хочешь делать?

Другие советы

Вы загружаете HTML -источник сайта, а не весь сайт. Это большая разница.

Посмотрите, как использовать HTML Agility Pack а также Вот этот

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top