Question

J'utilise PySolr pour exécuter ma recherche. Je veux indexer un flux rss et je me demandais si cela est possible en utilisant PySolr et si oui, comment faites-vous.

J'ai trouvé des instructions sur la façon de le faire dans Solr http: //wiki.apache .org / Solr / DataImportHandler # HttpDataSource_Example

mais ne peut pas trouver quoi que ce soit sur la façon de faire l'équivalent en PySolr

Merci

Était-ce utile?

La solution

Vous avez probablement ne pas besoin de faire l'équivalent en PySolr. Si vous avez déjà l'indexation Solr l'alimentation, selon l'exemple, vous utilisez juste PySolr pour interroger cet index. Quelque chose comme:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

Si vous voulez vraiment faire du côté Python, alors vous devrez chercher et analyser le RSS là-bas (en utilisant d'autres bibliothèques, par exemple Universal Feed Parser ); PySolr enveloppe juste l'interaction avec Solr, il ne fait pas « » sources de données.

Vous pouvez consulter Haystack , qui utilise PySolr (et peut utiliser d'autres moteurs) et des résumés soigneusement la l'emploi de créer des entrées d'index de recherche et de les expédier hors de Solr pour l'indexation.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top