문제

vb.net에 HTML의 태그 사이의 모든 공백을 제거하는 방법이 있습니까?

나는 이것을 가지고있다 :

<tr>
    <td>

내가 만든 문자열은 전체 HTML 문서이며, 태그 앞에있는 모든 것을 합법적 인 공간으로 계산하므로 트림을 제거해야합니다. 이 작업을 수행하는 데 사용할 수있는 reg ex 또는 기능이 있습니까?

감사

도움이 되었습니까?

해결책

문서의 복잡성에 따라 문서 전체에서 정규 표현식을 교체하면 다음과 같습니다.

regexobj.replace ( "> [ s n]*<", "> <")

.NET 및 정규식에 대해 읽을 수 있습니다 여기

다른 팁

위의 솔루션은 좋은 시작이지만 코드는 약간 잘못되었고 정규 표현식은 필요한 것보다 더 많습니다. 이 경우에 필요한 최소값은 다음과 같습니다.

Dim RegexObj As New Regex(">[\s]*<")

NewText = RegexObj.Replace(OldText, "><")

그만큼 \n .NET은 공백 문자 세트에 캐리지 리턴 및 라인 피드 문자가 포함되어 있기 때문에 불필요합니다. (\s). 다른 언어에 대해서는 확실하지 않습니다. 그리고 그렇지 않다면, 당신은 또한 \r Windows Newline이기 때문에 캐릭터 \r\n 동정형에서는뿐만 아니라 \n.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top