Frage

Ich habe einen DB mit einigen Textfeldern von MS Word eingefügt, und ich habe Probleme abzustreifen nur die und Tags, aber offensichtlich ihren Innertext zu halten.

Ich habe versucht, die HAP verwenden, aber ich bin nicht in der richtigen Richtung ..

Public Function StripHtml(ByVal html As String, ByVal allowHarmlessTags As Boolean) As String
    Dim htmlDoc As New HtmlDocument()
    htmlDoc.LoadHtml(html)
    Dim invalidNodes As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div|//font|//span")
    For Each node In invalidNodes
        node.ParentNode.RemoveChild(node, False)
    Next
    Return htmlDoc.DocumentNode.WriteTo()
End Function

Dieser Code wählt einfach die gewünschten Elemente und entfernt sie ... aber nicht ihren inneren Text zu halten ..

Vielen Dank im Voraus

War es hilfreich?

Lösung

Nun ... Ich denke, ich eine Lösung gefunden:

Public Function StripHtml(ByVal html As String) As String
    Dim htmlDoc As New HtmlDocument()
    htmlDoc.LoadHtml(html)
    Dim invalidNodes As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div|//font|//span|//p")
    For Each node In invalidNodes
        node.ParentNode.RemoveChild(node, True)
    Next
    Return htmlDoc.DocumentNode.WriteContentTo
End Function

Ich war fast da ...: P

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top