Gibt es ein Objekt in C #, die für die einfache Verwaltung von HTML-DOM ermöglicht?
-
28-09-2019 - |
Frage
Wenn ich eine Zeichenfolge, die den HTML von einer Seite enthält Ich wurde gerade von einem HTTP Post zurückgegeben, wie kann ich das zu etwas, das ich leicht das DOM durchqueren lassen?
I figured Htmldocument-Objekt würde Sinn machen, aber es hat keinen Konstruktor. Gibt es Typen, die für die einfache Verwaltung von HTML-DOM?
erlauben Danke,
Matt
Lösung
Der Htmldocument ist eine Instanz eines Dokuments, das bereits von einem WebBrowser-Steuerelement geladen wird. Somit kein Ctor.
Html Agility Pack- ist bei weitem der beste Bibliothek ich habe zu diesem Zweck verwendet
Ein Beispiel aus dem Codeplex-Wiki
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href]"))
{
HtmlAttribute att = link["href"];
att.Value = FixLink(att);
}
doc.Save("file.htm");
Das Beispiel zeigt eine Datei zu laden, aber es gibt Überlastungen, die Sie einen String oder einen Stream laden lassen.