Analizar las etiquetas de anclaje utilizando asp.net

https://stackoverflow.com/questions/2012154

c#
asp.net
parsing
plaintext

19-09-2019
|

Pregunta

Al analizar un montón de html en formato de texto plano, se regex la mejor manera de extraer y examinar todas las etiquetas de anclaje o hay algo integrado en el lib .net?

Solución

RegEx es que aquí pal. No hay ningún analizador de HTML integrado en el BCL.

Si la entrada es XHTML (o conformes XML), puede utilizar XML y XPath. Cargando el documento en un XmlDocument y seleccionando todas a nodos.

Otros consejos

Regex es buena. Sin embargo creo que el HTML agilidad empacar a ser un poco más tolerantes y es lo que me gustaría utilizar en esta situación .

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow