Welches ist das beste HTML ordentlich Pack? Gibt es eine Option in HTML Agilität Pack machen HTML-Webseite ordentlich?

StackOverflow https://stackoverflow.com/questions/2490765

Frage

Ich bin mit html Agilität packen zu parsen html tabellarische Informationen . Jetzt gibt es einige HTML-Inhalt mit Endtags fehlt und von einer solchen Seite wegen fehlender Endtags HTML Agility Pack nicht Parse-Informationen properly.So I-Tags eingefügt werden soll enden, wo es fehlt Endtags so html Agilität packt richtig Parsen Informationen. Also die fehlende Endtags einzufügen, was soll ich tun? Soll ich schreibe meinen eigenen Code für das oder die Verwendung html ordentlich verpacken , das zu tun?

Wenn html ordentlich packt dann, welche das beste ist HTML Tidy Pack , und wie es zu benutzen kein Beispiel, wenn möglich? Und wenn mein eigener Code als das, was es kann wie sein?

Gibt es jede Option in HTML-Agilität packen , das wir in der Lage ersten make machen kann die HTML-Seite ordentlich und dann Parst die Webseite.

War es hilfreich?

Lösung

In Html Agility Pack I konnte keine Möglichkeit finden, dass make HTML-Seite tidy.There ist eine Option, dass Einsätze der fehlenden Schließen-Tags, aber es funktioniert in einiger HTML-Seite only.That Option in HTML Agility Pack ist,

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;

Ich habe auch versucht, regex für das, aber es auch Arbeit für einige HTML-Seite nur.

So fand ich das beste HTML Tidy Pack ist:

http://www.devx.com/dotnet / Artikel / 20505/1763 / page / 2.

Wir sehen, es kann: wie die DLL importieren und wie Sie diese ordentlich Pack zu verwenden, gibt es Beispielcode zur Verfügung. Es ist toll, bei all.It kann die fehlt Schließen-Tags einfügen und macht Ihre HTML-Seite ordentlich.

Danke für die Hilfe jeder ..

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top