¿Cómo se analiza el DOM? [duplicar]
Pregunta
Duplicar posibles:
Si no se supone utilizar expresiones regulares para analizar HTML, entonces, ¿cómo se escriben los analizadores HTML?
Mi pregunta es simple: ¿Cómo analizadores DOM actuales realmente analizar el DOM de una cadena (XML, HTML o de otro tipo)
?Sé que no debe analizar HTML con expresiones regulares , pero podría no un analizador DOM uso expresiones regulares para que coincida con las pautas de etiquetas de apertura / cierre? O, ¿hay una buena vez en off algoritmo para analizar la cadena proporcionada como un array de caracteres?
Otros consejos
Bueno, usted podría comenzar con un enfoque básico a lo largo de las líneas de:
http://www.blackbeltcoder.com/Articles/ Strings / análisis sintáctico-html-tags-en-c
Y a continuación, sólo expandirlo para almacenar todo en la estructura de árbol DOM completo.