Frage

Gibt es eine Möglichkeit in VB.NET alle die Leerzeichen zwischen den Tags in HTML zu entfernen?

Sagen Sie, ich habe diese:

<tr>
    <td>

Die Zeichenfolge ich gebaut habe, ist ein ganzes HTML-Dokument, und es zählt alles, bevor diese Tags als legitime Raum, also muß ich es trimmen. Gibt es eine reg ex oder Funktion gibt ich, dies zu tun verwenden könnte?

Danke

War es hilfreich?

Lösung

Abhängig von der Komplexität des Dokuments, müssen Sie wahrscheinlich nur einen Ersatz für reguläre Ausdrücke über das Dokument ... So etwas wie:

RegexObj.Replace ( "> [\ s \ n] * <", "> <")

Sie können über .NET und reguläre Ausdrücke lesen hier

Andere Tipps

Die obige Lösung ist ein guter Anfang, aber der Code ist etwas falsch, und der reguläre Ausdruck ist mehr als es sein muss. Hier ist das Minimum, das Sie brauchen würden in diesem Fall zu tun:

Dim RegexObj As New Regex(">[\s]*<")

NewText = RegexObj.Replace(OldText, "><")

Die \n unnötig ist, weil .Net den Wagenrücklauf und Zeilenvorschub-Zeichen in dem Satz von Leerzeichen (\s) enthält. Nicht sicher andere Sprachen. Und wenn es nicht täte, würde man auch die \r Zeichen enthalten müssen, da eine Windows Newline \r\n in einem regulären Ausdruck, nicht nur \n.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top