Как сканировать фид
-
22-08-2019 - |
Вопрос
Моему приложению необходимо отслеживать каналы RSS/Atom и сохранять новые записи в базе данных.Мой вопрос в том, Какой самый надежный способ определить, просканирована ли уже запись в фиде или нет?
я использую Универсальный парсер каналов модуль для анализа каналов.Моя текущая реализация записывает последнее значение feed.entry[i].updated_parsed
, при ползании, если updated_parsed
значение записи больше записанного значения, то эта запись сохраняется в базе данных.Проблема здесь в том, что у многих каналов нет даты публикации или даты обновления.
Решение
Вы должны определить, просканировали ли вы уже запись, ссылаясь на ее <guid>
прежде всего (возвращаясь к <link>
в отсутствие <guid>
), а все, что связано с датами, только в качестве вторичного анализа.