GoogleリーダーはRSSフィードのすべてのアイテムをどのように取得しますか?
-
03-07-2019 - |
質問
SlashdotのRSSフィードは http://rss.slashdot.org/Slashdot/slashdot です。 。 XMLファイルを直接ダウンロードした場合、今日の記事の一部しか取得できません。ただし、Googleリーダーでフィードを購読し、「無限スクロール」でスクロールし続けると、インターフェース、過去から任意の数のSlashdotの投稿を取得できるようです-おそらくすべてのSlashdotの投稿を取得できますか?
- GoogleリーダーがRSSフィードから無制限の数の投稿を取得する方法
- どうすれば同じことができますか?
解決
Googleはすべてのユーザーに対してフィードの1つのインスタンスを追跡するため、たとえば新しい購読者が読書を開始するずっと前から、Slashdotの記事を追跡して保存しています。
同じことを行うには、必要なRSSフィードを定期的にポーリングし、見つけたユニークな記事をローカルに保存する必要があります。
他のヒント
認証された場合、次のようなことができることを発見しました:
http: //www.google.com/reader/atom/feed/http://rss.slashdot.org/Slashdot/slashdot?n=100
フィードから任意の数の結果を取得します。
彼らは何年もの間Webのインデックスを作成しており、やってくるものはすべて保存しています。そのため、「これにサブスクライブ」を追加した瞬間Googleクローラーがページへのリンクを作成すると、そのページのインデックス作成が開始され、保存されます。
RSSの場合、複数の人が同じフィードを購読するという利点もあります。
アプリケーションでは、ダウンロードしたアイテムをローカルに保存することでこれを解決することをお勧めします。これにより、新しい購読者が最初のユーザーがそのフィードを購読した時点に戻ることができます。無制限ではありませんが、時間の経過とともに、最新の20個のアイテムよりもはるかに大きなアーカイブが提供されます。
あなたが話していることを行うRSSアーカイブサービスを構築しました( https://app.pub.center )。すべてのRSSはRESTを介して無料で使用できます。プッシュ通知が必要な場合は、有料プランに切り替える必要があります。
PubCenterは、RSSフィードのカタログを毎日ポーリングし、記事をキャッシュします。その後、これらの記事を時系列順に戻すことができます。例:
The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=1
The Atlantic https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=2