Вопрос

Я использую PySolr для поиска.Я хочу проиндексировать RSS-канал, и мне интересно, возможно ли это с помощью PySolr, и если да, то как это сделать.

Я нашел инструкции о том, как это сделать в Solr по адресу http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example

но не могу найти ничего о том, как сделать эквивалент в PySolr

Спасибо

Это было полезно?

Решение

Вероятно, вам не нужно делать то же самое в PySolr.Если у вас уже есть Solr, индексирующий канал, как показано в примере, вы просто используете PySolr для запроса этого индекса.Что-то вроде:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

Если вы действительно хотите сделать это со стороны Python, вам нужно будет получить и проанализировать RSS там (используя другие библиотеки, например Универсальный парсер каналов);PySolr просто осуществляет взаимодействие с Solr, а не «работает» с источниками данных.

Вы можете проверить стог сена, который использует PySolr (и может использовать другие движки) и аккуратно абстрагирует работу по созданию записей индекса поиска и отправке их в Solr для индексации.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top