Pregunta

Duplicar posibles:
Si no se supone utilizar expresiones regulares para analizar HTML, entonces, ¿cómo se escriben los analizadores HTML?

Mi pregunta es simple: ¿Cómo analizadores DOM actuales realmente analizar el DOM de una cadena (XML, HTML o de otro tipo)

?

Sé que no debe analizar HTML con expresiones regulares , pero podría no un analizador DOM uso expresiones regulares para que coincida con las pautas de etiquetas de apertura / cierre? O, ¿hay una buena vez en off algoritmo para analizar la cadena proporcionada como un array de caracteres?

Otros consejos

Bueno, usted podría comenzar con un enfoque básico a lo largo de las líneas de:

http://www.blackbeltcoder.com/Articles/ Strings / análisis sintáctico-html-tags-en-c

Y a continuación, sólo expandirlo para almacenar todo en la estructura de árbol DOM completo.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top