我使用PySolr运行我的搜索。我想索引的RSS源,并想知道这是否使用PySolr是可能的,如果是你怎么做。

我已经找到了如何做到这一点Solr中说明在 HTTP://wiki.apache .ORG / solr的/ DataImportHandler#HttpDataSource_Example

但无法找到如何在PySolr做任何等价

由于

有帮助吗?

解决方案

您也许并不需要做PySolr相当。如果你已经有了Solr的索引饲料,按该例子,那么你只需要使用PySolr来查询索引。是这样的:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

如果你真的想从Python侧做,那么你就需要获取并解析RSS有(用其他库,如的通用Feed解析器); PySolr只是包装使用Solr的相互作用,它并不“做”的数据源。

您可能想看看草垛,它采用PySolr(并且可以使用其他引擎),并整齐地抽象生成搜索索引条目和运输它们关闭到Solr用于索引的工作。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top