PySolr RSS データインポート
-
22-09-2019 - |
質問
検索を実行するために PySolr を使用しています。RSS フィードにインデックスを付けたいのですが、PySolr を使用してこれが可能かどうか、可能であればどのようにすればよいか疑問に思っていました。
Solr でこれを行う方法については、次の場所で説明を見つけました。 http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example
しかし、PySolrで同等のことを行う方法については何も見つかりません
ありがとう
解決
おそらく、PySolr で同等のことを行う必要はありません。例のように、すでに Solr でフィードのインデックスを作成している場合は、PySolr を使用してそのインデックスをクエリするだけです。何かのようなもの:
from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
do_stuff_with(result)
本当に Python 側から実行したい場合は、そこで (他のライブラリを使用して) RSS をフェッチして解析する必要があります。 ユニバーサル フィード パーサー);PySolr は Solr との対話をラップするだけであり、データ ソースを「実行」するわけではありません。
チェックしてみてはいかがでしょうか 干し草の山, これは PySolr を使用し (他のエンジンも使用可能)、検索インデックス エントリを作成し、インデックス作成のために Solr に送信するジョブをきちんと抽象化します。
所属していません StackOverflow