Question

Je suis en train de télécharger HTML afin que je puisse l'analyser en utilisant la bande passante minimum à télécharger. Ceci est un peu de mon code.

if (!String.IsNullOrEmpty(siteAddress))
                webReq = WebRequest.Create(siteAddress)

                WebResponse webRes = webReq.GetResponse();

                Stream streamResponse = webRes.GetResponseStream();
                StreamReader streamRead = new StreamReader(streamResponse);
                StringReader sr = new StringReader(streamRead.ReadToEnd().Trim());

                streamResponse.Close();
                streamRead.Close();    
                webRes.Close();

                HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
                hDoc.Load(sr);

Quelqu'un peut-il confirmer que la récupération de la réponse ne fournit que la réponse de texte et aucune image sont téléchargées aussi? Qu'en est-il quand il chargement avec la méthode HTMLAgilityPack?

Était-ce utile?

La solution

Lors de l'utilisation WebClient, WebRequest ou HtmlAgilityPack il est seulement le html vous téléchargerez.

Si vous voulez que les images (ou d'autres ressources), vous devez rechercher l'image urls dans le document téléchargé et demandes de problème vous-même pour les obtenir.

Si vous voulez expérimenter un peu, le contrôle WebBrowser pourrait être quelque chose à regarder. De là, vous pouvez prendre la propriété Document et son regard sur Images propriété et télécharger toutes les images vous-même.

Que voulez-vous faire?

Autres conseils

source de téléchargement HTML du site, et non pas l'ensemble du site. C'est une grande différence.

Voir Comment utiliser HTML Agility pack aussi this un

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top