Как проанализирован DOM? [Дубликат

https://stackoverflow.com/questions/4638067

08-10-2019
|

Вопрос

Возможный дубликат:
Если вы не должны использовать регулярные выражения для Parse HTML, то как написано HTML Parsers?

Мой вопрос простой: как текущие парсеры DOM фактически Разбирайте DOM из строки (XML, HTML или иным образом)?

Я знаю Вы не должны разбирать HTML с Regex, но не мог не использовать ROM Parser, чтобы соответствовать шаблонам для открытых / близких тегов? Или есть хороший алгоритм один раз в течение анализа предоставленной строки в качестве массива символов?

Решение

Посмотри на это:

alt text

Вот хороший пример

Другие советы

Ну, вы можете начать с базового подхода по линиям:

http://www.blackbeltcoder.com/articles/strings/parsing-html-tags-in-c.

И тогда просто расширяйте его, чтобы сохранить все в полную структуру дерева DOM.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow