Pergunta

Preciso filtrar tags âncora em uma string.Por exemplo,

Check out this site: <a href="http://www.stackoverflow.com">stackoverflow</a>

Preciso ser capaz de filtrar a tag âncora para isso:

Check out this site: http://www.stackoverflow.com

Esse formato também pode não ser constante.Pode haver outros atributos para a tag âncora.Além disso, pode haver mais de uma tag âncora na string.Estou fazendo a filtragem no vb.net antes de ir para o banco de dados.

Foi útil?

Solução

Aqui está uma expressão regular simples que deve funcionar.

Imports System.Text.RegularExpressions

' ....

Dim reg As New Regex("<a.*?href=(?:'|"")(.+?)(?:'|"").*?>.+?</a>")
Dim input As String = "This is a link: <a href='http://www.stackoverflow.com'>Stackoverflow</a>"
input = reg.Replace(input, "$1", RegexOptions.IgnoreCase)
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top