Filtrando tags âncora em uma string
Pergunta
Preciso filtrar tags âncora em uma string.Por exemplo,
Check out this site: <a href="http://www.stackoverflow.com">stackoverflow</a>
Preciso ser capaz de filtrar a tag âncora para isso:
Check out this site: http://www.stackoverflow.com
Esse formato também pode não ser constante.Pode haver outros atributos para a tag âncora.Além disso, pode haver mais de uma tag âncora na string.Estou fazendo a filtragem no vb.net antes de ir para o banco de dados.
Solução
Aqui está uma expressão regular simples que deve funcionar.
Imports System.Text.RegularExpressions
' ....
Dim reg As New Regex("<a.*?href=(?:'|"")(.+?)(?:'|"").*?>.+?</a>")
Dim input As String = "This is a link: <a href='http://www.stackoverflow.com'>Stackoverflow</a>"
input = reg.Replace(input, "$1", RegexOptions.IgnoreCase)
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow