فرز حسب التاريخ في المؤسسة العامة لاستصلاح الأراضي/لوسين مشاكل الأداء

StackOverflow https://stackoverflow.com/questions/1819168

  •  10-07-2019
  •  | 
  •  

سؤال

لدينا انشاء المؤسسة العامة لاستصلاح الأراضي مؤشر تحتوي على 36 مليون وثيقة (~1K-2K كل) ونحن نحاول أن الاستعلام الحد الأقصى من 100 المستندات مطابقة واحدة بسيطة الكلمات الرئيسية.هذا يعمل بشكل سريع جدا كما كنا نأمل.ومع ذلك, إذا نحن الآن إضافة "&sort=createDate+desc" إلى الاستعلام (وبالتالي يسأل عن أفضل 100 "الجديدة" المستندات مطابقة الاستعلام) فإنه يعمل لفترة طويلة جدا و أخيرا النتائج في OutOfMemoryException.من ما قد يفهم من دليل هذا هو بسبب حقيقة أن لوسين يحتاج إلى تحميل كل قيم واضحة في هذا المجال (createDate) في الذاكرة (على FieldCache afaik) قبل أن يمكن تنفيذ الاستعلام.كما createDate مجال تحتوي على التاريخ والوقت وعدد من قيم واضحة إلى حد كبير.من المهم أيضا أن نذكر أننا في كثير من الأحيان تحديث الفهرس.

ربما شخص ما يمكن أن نقدم بعض الأفكار والاتجاهات بشأن كيف يمكننا ضبط لوسين / المؤسسة العامة لاستصلاح الأراضي أو تغيير نهجنا في مثل هذه الطريقة التي الاستعلام مرات تصبح مقبولة ؟ المدخلات الخاصة بك سوف تكون محل تقدير كبير!شكرا

هل كانت مفيدة؟

المحلول

والمشكلة هي لوسين أرقام مخازن كسلاسل. هناك بعض المرافق، والذي انقسم التاريخ في YYYY، MM، DD ووضعها في مختلف المجالات. الذي يعطي نتائج أفضل بكثير.

نسخة

وأحدث من لوسين (2.9 وما بعده) تدعم حقول رقمية وتحسينات في الأداء وكبير (عدة أوامر من حجم، IIRC.) تحقق <لأ href = "http://www.lucidimagination.com/blog/2009/ 13/5 / استكشاف-لوسين و-solrs-trierange-قدرات / "يختلط =" نوفولو noreferrer "> هذه المقالة حول الاستعلامات رقمية.

نصائح أخرى

يمكنك فرز النتائج حسب ترتيب فهرس بدلا من ذلك.نوع مواصفات تنازلي حسب الوثيقة رقم:

new SortField(null, SortField.DOC, true)

يجب عليك أيضا تقسيم مؤشر الدلائل من خلال حقل التاريخ.جميع المستندات المطابقة يتم فحصها من قبل لوسين عند جمع أعلى ن النتائج.التقسيم سيتم تقسيم درست المجموعة.أنت لا تحتاج إلى دراسة كبار السن أقسام ، إذا كان لديك N النتائج في أحدث التقسيم.

وحاول تحويل لك بيانات التسجيل نوع إلى نوع سلسلة (مثل ميلي ثانية).

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top