Вопрос

Моему приложению необходимо отслеживать каналы RSS/Atom и сохранять новые записи в базе данных.Мой вопрос в том, Какой самый надежный способ определить, просканирована ли уже запись в фиде или нет?

я использую Универсальный парсер каналов модуль для анализа каналов.Моя текущая реализация записывает последнее значение feed.entry[i].updated_parsed, при ползании, если updated_parsed значение записи больше записанного значения, то эта запись сохраняется в базе данных.Проблема здесь в том, что у многих каналов нет даты публикации или даты обновления.

Это было полезно?

Решение

Вы должны определить, просканировали ли вы уже запись, ссылаясь на ее <guid> прежде всего (возвращаясь к <link> в отсутствие <guid>), а все, что связано с датами, только в качестве вторичного анализа.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top