Как проанализирован DOM? [Дубликат
Вопрос
Возможный дубликат:
Если вы не должны использовать регулярные выражения для Parse HTML, то как написано HTML Parsers?
Мой вопрос простой: как текущие парсеры DOM фактически Разбирайте DOM из строки (XML, HTML или иным образом)?
Я знаю Вы не должны разбирать HTML с Regex, но не мог не использовать ROM Parser, чтобы соответствовать шаблонам для открытых / близких тегов? Или есть хороший алгоритм один раз в течение анализа предоставленной строки в качестве массива символов?
Решение
Другие советы
Ну, вы можете начать с базового подхода по линиям:
http://www.blackbeltcoder.com/articles/strings/parsing-html-tags-in-c.
И тогда просто расширяйте его, чтобы сохранить все в полную структуру дерева DOM.
Не связан с StackOverflow