Frage

Ich verwende PySolr meine Suche auszuführen. Ich möchte einen RSS-Feed-Index und frage mich, ob dies möglich ist PySolr verwenden und wenn ja, wie wollen Sie tun es.

Ich habe gefunden, Anweisungen, wie dies in Solr zu tun, unter http: //wiki.apache .org / Solr / DataImportHandler # HttpDataSource_Example

kann aber nichts finden, wie das Äquivalent in PySolr zu tun

Danke

War es hilfreich?

Lösung

Sie brauchen wahrscheinlich nicht das Äquivalent in PySolr zu tun. Wenn Sie bereits Solr den Feed Indizierung haben, gemäß dem Beispiel, dann verwenden Sie nur PySolr diesen Index abfragen. So etwas wie:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

Wenn Sie es wirklich von der Python Seite tun wollen, dann müssen Sie holen und die RSS dort (mit anderen Bibliotheken zu analysieren, zB Universal-Feed Parser ); PySolr wickelt nur die Interaktion mit Solr, spielt es keine Datenquellen „tun“.

Sie können wollen Haystack , die verwendet PySolr (und andere Motoren verwendet werden können) und abstrahiert ordentlich die Aufgabe der Einträge Indexsuche Erstellung und Versand sie für die Indizierung Solr aus.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top