Вопрос

Возможный дубликат:
Если вы не должны использовать регулярные выражения для Parse HTML, то как написано HTML Parsers?

Мой вопрос простой: как текущие парсеры DOM фактически Разбирайте DOM из строки (XML, HTML или иным образом)?

Я знаю Вы не должны разбирать HTML с Regex, но не мог не использовать ROM Parser, чтобы соответствовать шаблонам для открытых / близких тегов? Или есть хороший алгоритм один раз в течение анализа предоставленной строки в качестве массива символов?

Это было полезно?

Другие советы

Ну, вы можете начать с базового подхода по линиям:

http://www.blackbeltcoder.com/articles/strings/parsing-html-tags-in-c.

И тогда просто расширяйте его, чтобы сохранить все в полную структуру дерева DOM.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top