Pregunta

Al analizar un montón de html en formato de texto plano, se regex la mejor manera de extraer y examinar todas las etiquetas de anclaje o hay algo integrado en el lib .net?

¿Fue útil?

Solución

RegEx es que aquí pal. No hay ningún analizador de HTML integrado en el BCL.

Si la entrada es XHTML (o conformes XML), puede utilizar XML y XPath. Cargando el documento en un XmlDocument y seleccionando todas a nodos.

Otros consejos

Regex es buena. Sin embargo creo que el HTML agilidad empacar a ser un poco más tolerantes y es lo que me gustaría utilizar en esta situación .

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top