Вопрос

Я работаю над проектом, который требует надежного доступа к историческим записям фидов, которые не обязательно доступны в текущей ленте веб-сайта. Я нашел несколько способов доступа к таким данным, но ни один из них не дает мне все необходимые характеристики.

Посмотрите на это как на мозговой штурм. Я скажу вам, сколько я нашел, и вы можете внести свой вклад, если у вас есть какие-либо другие идеи.

<Ол>
  • API Google AJAX Feed - ограничит вас до 250 элементов

  • Неофициальный API Google Reader - Идеально, но неофициально и, следовательно, ненадежно (и, возможно, почти незаконно?). Кроме того, аутентификация кажется сложной задачей.

  • Spinn3r - стоит много денег

  • Spidering интернет-архив на сайте фида - много сложности, местное освещение, полезно только в крайнем случае

  • Yahoo! API фида или Yahoo! Поиск BOSS . Первый из них больше похож на агрегатор. Это означает, что мне потребуется отдельная регистрация для каждого канала, а второй должен предоставить больше доступа к данным Yahoo, но я не могу найти упоминания о каналах.

  • (спасибо Лу Франко) API синхронизации блогов - помимо Проблема в том, что требуется учетная запись и она больше предназначена для использования в качестве агрегатора, но не позволяет добавлять каналы в учетную запись. Таким образом, нет поиска произвольных каналов. Сначала вам нужно вручную добавить их через ридер.

  • Другие поисковые системы / поиск по блогам / что угодно?

  • Это действительно раздражающая проблема, поскольку мы говорим о семантической информации, которая когда-то существовала, все еще (обычно) действительна, но трудна для доступа надежно, свободно и без ограничений. Кто-нибудь знает какие-либо альтернативные источники качества корма?

    Это было полезно?

    Решение 2

    Лучший ответ, который я нашел на данный момент, заключается в следующем: неофициальный API читателя Google, оказывается, имеет общедоступную точку доступа для своих каналов, что означает, что аутентификация не требуется. Используйте это следующим образом:

    http://www.google.com/reader/public/atom/feed / {ваш фид uri здесь}? n = 1000

    замените текст в squigglies (включая сами squigglies) на интересующий вас URI канала. Более подробную информацию о точных аргументах можно найти здесь:

    http: // blog .martindoms.com / 2009/10/16 / с использованием-The-Google-ридер-апи-часть-2 /

    но не забудьте использовать / public / url, если вы не хотите связываться с аутентификацией

    Другие советы

    Bloglines имеет API для синхронизации учетных записей

    http://www.bloglines.com/services/api/sync

    Вы должны создать учетную запись, подписаться на фид, который вы хотите загрузить, но затем вы можете загружать на основе даты, что может быть в прошлом. Не уверен в условиях.

    Лицензировано под: CC-BY-SA с атрибуция
    Не связан с StackOverflow
    scroll top