سؤال

أنا أستخدم pysolr لتشغيل بحثي. أرغب في فهرسة موجز RSS وكنت أتساءل عما إذا كان هذا ممكنًا باستخدام pysolr وما إذا كان الأمر كذلك ، فكيف تفعل ذلك.

لقد وجدت تعليمات حول كيفية القيام بذلك في SOLR في http://wiki.apache.org/solr/dataimporthandler#httpdatasource_example

لكن لا يمكنك العثور على أي شيء حول كيفية القيام بما يعادل في Pysolr

شكرًا

هل كانت مفيدة؟

المحلول

ربما لا تحتاج إلى القيام بما يعادل في Pysolr. إذا كان لديك بالفعل SOLR يفهرس الخلاصة ، وفقًا للمثال ، فأنت فقط تستخدم Pysolr للاستعلام عن هذا الفهرس. شيء مثل:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

إذا كنت ترغب حقًا في القيام بذلك من جانب Python ، فستحتاج إلى جلب RSS وتحليلها هناك (باستخدام مكتبات أخرى ، على سبيل المثال محلل التغذية العالمي) ؛ Pysolr يلف التفاعل مع SOLR فقط ، فإنه لا "يفعل" مصادر البيانات.

قد ترغب في التحقق كومة قش, ، الذي يستخدم pysolr (ويمكنه استخدام محركات أخرى) وتجريد بدقة مهمة إنشاء إدخالات فهرس البحث وشحنها إلى SOLR للفهرسة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top