문제

나는지 알고 싶은 경우가 있는 간단한 방법 분석에서 HTML vb.net.내가 알고 있는 HTML 지 않 sctrict 하위 집합의 XML,그러나 그것은 좋은 것입 될 수 있는 경우에 처리하는 방법입니다.은 거기에 아무것도 있게 분석 HTML XML 과 같은 방법으로서 VB.net?

도움이 되었습니까?

해결책

Html 민첩성 pack -그것은 매우 개발자,무료 소스 코드를 사용할 수 있습니다.

다른 팁

추가'를 prog ref 도:Microsoft.mshtml

'다음 페이지:

Imports mshtml

Function parseMyHtml(ByVal htmlToParse$) As String
    Dim htmlDocument As IHTMLDocument2 = New HTMLDocumentClass()
    htmlDocument.write(htmlToParse)
    htmlDocument.close()

    Dim allElements As IHTMLElementCollection = htmlDocument.body.all

    Dim allInputs As IHTMLElementCollection = allElements.tags("a")
    Dim element As IHTMLElement
    For Each element In allInputs
        element.title = element.innerText
    Next

    Return htmlDocument.body.innerHTML
End Function

으로 발견 :

하는 경우 다음과 같이 HTML XHTML 기준,당신이 할 수 있는 많은의 분석과 처리를 사용하는 System.XML 네임스페이스 클래스입니다.

는 경우,다른 한편으로는,당신 분석은 웹 개발자를 참조로"태그 수프,"당신은 필요한 파일을 열 수처 HTML 민첩성 Pack.

이 부분의 문제에 대한 해결책을하려는 경우 그 밖으로 어떻게 브라우저 해석합니다 당신의 HTML 으로 각 브라우저 구문 분석 태그 스프게 확인할 수 있게 되었습니다.

를 사용하지 않는 민첩성이 팩을 사용 mshtml 라이브러리에 액세스하 dom,이것은 무엇 ie 사용하기 위해 좋은 것을 통해 HTML 요소입니다.

민첩성이 팩을 불쾌하고 불필요하게 hackie 당신이 저를 요구하는 경우,mshtml 는 방법입니다.지 msdn.

그것은 잘 형성되는?는 경우 HTML 는 사실을 잘 형성하실 수 있습니다 다음으로 구문 분석 XML.는 경우 그것은 태그 스프가 닫히지 않은 요소와 같은 생각을 해야 주위에 사냥을 위해 타사의 솔루션입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top