GoogleリーダーはRSSフィードのすべてのアイテムをどのように取得しますか?

StackOverflow https://stackoverflow.com/questions/220878

  •  03-07-2019
  •  | 
  •  

質問

SlashdotのRSSフィードは http://rss.slashdot.org/Slashdot/slashdot です。 。 XMLファイルを直接ダウンロードした場合、今日の記事の一部しか取得できません。ただし、Googleリーダーでフィードを購読し、「無限スクロール」でスクロールし続けると、インターフェース、過去から任意の数のSlashdotの投稿を取得できるようです-おそらくすべてのSlashdotの投稿を取得できますか?

  1. GoogleリーダーがRSSフィードから無制限の数の投稿を取得する方法
  2. どうすれば同じことができますか?
役に立ちましたか?

解決

Googleはすべてのユーザーに対してフィードの1つのインスタンスを追跡するため、たとえば新しい購読者が読書を開始するずっと前から、Slashdotの記事を追跡して保存しています。

同じことを行うには、必要なRSSフィードを定期的にポーリングし、見つけたユニークな記事をローカルに保存する必要があります。

他のヒント

認証された場合、次のようなことができることを発見しました:

http: //www.google.com/reader/atom/feed/http://rss.slashdot.org/Slashdot/slashdot?n=100

フィードから任意の数の結果を取得します。

彼らは何年もの間Webのインデックスを作成しており、やってくるものはすべて保存しています。そのため、「これにサブスクライブ」を追加した瞬間Googleクローラーがページへのリンクを作成すると、そのページのインデックス作成が開始され、保存されます。

RSSの場合、複数の人が同じフィードを購読するという利点もあります。

アプリケーションでは、ダウンロードしたアイテムをローカルに保存することでこれを解決することをお勧めします。これにより、新しい購読者が最初のユーザーがそのフィードを購読した時点に戻ることができます。無制限ではありませんが、時間の経過とともに、最新の20個のアイテムよりもはるかに大きなアーカイブが提供されます。

あなたが話していることを行うRSSアーカイブサービスを構築しました( https://app.pub.center )。すべてのRSSはRESTを介して無料で使用できます。プッシュ通知が必要な場合は、有料プランに切り替える必要があります。

PubCenterは、RSSフィードのカタログを毎日ポーリングし、記事をキャッシュします。その後、これらの記事を時系列順に戻すことができます。例:

The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=1

の1ページ目

The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=2

の2ページ目
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top