Accesso a voci di feed precedenti, non più disponibili
Domanda
Sto lavorando a un progetto che richiede un accesso affidabile alle voci dei feed storici che non sono necessariamente disponibili nel feed corrente del sito Web. Ho trovato diversi modi per accedere a tali dati, ma nessuno di questi mi offre tutte le caratteristiche di cui ho bisogno.
Guarda questo come un lampo di genio. Ti dirò quanto ho trovato e puoi contribuire se hai altre idee.
-
API feed AJAX Google - ti limiterà a 250 articoli
-
API non ufficiale di Google Reader - Perfetto ma non ufficiale e quindi inaffidabile (e forse quasi illegale?). Inoltre, l'autenticazione sembra essere complicata.
-
Spinn3r - Costa un sacco di soldi
-
Spidering archivio Internet sul sito del feed - Molta complessità, copertura macchiata, utile solo come ultima risorsa
-
Yahoo! API feed o Yahoo! Search BOSS - Il primo assomiglia di più a un aggregatore, il che significa che avrei bisogno di una registrazione diversa per ogni feed e il secondo dovrebbe dare più accesso ai dati di Yahoo, ma non riesco a trovare alcun riferimento ai feed.
-
(grazie a Lou Franco) API di sincronizzazione di Bloglines - Oltre al problema di aver bisogno di un account e di essere progettato più come aggregatore, non ha un modo per aggiungere feed all'account. Quindi nessun recupero di feed arbitrari. Devi prima aggiungerli manualmente tramite il lettore.
-
Altri motori di ricerca / ricerca blog / qualunque cosa?
Questo è un problema davvero irritante poiché stiamo parlando di informazioni semantiche che una volta erano là fuori, sono ancora (di solito) valide, ma è difficile accedervi in ??modo affidabile, libero e senza limiti. Qualcuno conosce fonti alternative per la bontà di ingresso al feed?
Soluzione 2
La migliore risposta che ho trovato finora è questa: l'API non ufficiale del lettore di Google risulta avere un punto di accesso pubblico per i loro feed, il che significa che non è necessaria alcuna autenticazione. L'uso è il seguente:
http://www.google.com/reader/public/atom/feed / {il tuo feed uri qui}? n = 1000
sostituisci il testo negli squiggli (compresi gli stessi squiggli) con l'URI del feed che ti interessa. Maggiori informazioni sugli argomenti precisi sono disponibili qui:
http: // blog .martindoms.com / 2009/10/16 / utilizzando-the-google-reader-api-parte-2 /
ma ricordati di usare / public / url se non vuoi fare confusione con l'autenticazione
Altri suggerimenti
Bloglines ha un'API per sincronizzare gli account
http://www.bloglines.com/services/api/sync
Devi creare un account, iscriverti al feed che vuoi scaricare, ma poi puoi scaricare in base alla data, che può essere molto lontana. Non sono sicuro dei termini.