Domanda

Sto usando PySolr per eseguire la mia ricerca. Voglio indice di un feed RSS e chiedevo se questo è possibile utilizzando PySolr e se sì, come si fa a farlo.

Ho trovato le istruzioni su come fare questo in Solr a http: //wiki.apache .org / solr / DataImportHandler # HttpDataSource_Example

, ma non riesce a trovare nulla su come fare l'equivalente in PySolr

Grazie

È stato utile?

Soluzione

Probabilmente non c'è bisogno di fare l'equivalente in PySolr. Se si dispone già di Solr l'indicizzazione del mangime, come per l'esempio, poi basta usare PySolr per interrogare tale indice. Qualcosa di simile:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

Se si vuole veramente farlo dal lato Python, allora avrete bisogno di recuperare e analizzare il RSS lì (con altre biblioteche, ad esempio, Universal feed Parser ); PySolr appena avvolge l'interazione con Solr, non “fare” fonti di dati.

Si consiglia di controllare le Haystack , che utilizza PySolr (e può utilizzare altri motori) e ordinatamente astrae la lavoro di creazione di voci di indice di ricerca e spedizione via a Solr per l'indicizzazione.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top