vb.net HTML 태그 사이의 공백을 교체하십시오
-
22-07-2019 - |
문제
vb.net에 HTML의 태그 사이의 모든 공백을 제거하는 방법이 있습니까?
나는 이것을 가지고있다 :
<tr>
<td>
내가 만든 문자열은 전체 HTML 문서이며, 태그 앞에있는 모든 것을 합법적 인 공간으로 계산하므로 트림을 제거해야합니다. 이 작업을 수행하는 데 사용할 수있는 reg ex 또는 기능이 있습니까?
감사
해결책
문서의 복잡성에 따라 문서 전체에서 정규 표현식을 교체하면 다음과 같습니다.
regexobj.replace ( "> [ s n]*<", "> <")
.NET 및 정규식에 대해 읽을 수 있습니다 여기
다른 팁
위의 솔루션은 좋은 시작이지만 코드는 약간 잘못되었고 정규 표현식은 필요한 것보다 더 많습니다. 이 경우에 필요한 최소값은 다음과 같습니다.
Dim RegexObj As New Regex(">[\s]*<")
NewText = RegexObj.Replace(OldText, "><")
그만큼 \n
.NET은 공백 문자 세트에 캐리지 리턴 및 라인 피드 문자가 포함되어 있기 때문에 불필요합니다. (\s)
. 다른 언어에 대해서는 확실하지 않습니다. 그리고 그렇지 않다면, 당신은 또한 \r
Windows Newline이기 때문에 캐릭터 \r\n
동정형에서는뿐만 아니라 \n
.
제휴하지 않습니다 StackOverflow