PySolr RSS dataimport
-
22-09-2019 - |
题
我使用PySolr运行我的搜索。我想索引的RSS源,并想知道这是否使用PySolr是可能的,如果是你怎么做。
我已经找到了如何做到这一点Solr中说明在 HTTP://wiki.apache .ORG / solr的/ DataImportHandler#HttpDataSource_Example
但无法找到如何在PySolr做任何等价
由于
解决方案
您也许并不需要做PySolr相当。如果你已经有了Solr的索引饲料,按该例子,那么你只需要使用PySolr来查询索引。是这样的:
from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
do_stuff_with(result)
如果你真的想从Python侧做,那么你就需要获取并解析RSS有(用其他库,如的通用Feed解析器); PySolr只是包装使用Solr的相互作用,它并不“做”的数据源。
您可能想看看草垛,它采用PySolr(并且可以使用其他引擎),并整齐地抽象生成搜索索引条目和运输它们关闭到Solr用于索引的工作。
不隶属于 StackOverflow