سؤال

لدي مؤشر Lucene بسيط نسبيًا، ويتم تقديمه بواسطة Solr.يتكون الفهرس من حقلين رئيسيين، العنوان والنص، وعدد قليل من الحقول الأقل أهمية.

تعطي معظم محركات البحث صلة أكبر بالنتائج التي تحتوي على تطابقات في العنوان، فوق النص.سأبدأ في توفير تعزيز وقت الفهرس لحقل العنوان.

سؤالي هو، ما هي القيم التي يستخدمها الأشخاص عادةً لحقول العناوين الخاصة بهم؟2؟4؟10؟100؟

هل كانت مفيدة؟

المحلول

أقترح عليك تقسيم متوسط ​​طول الجسم على متوسط ​​طول العنوان.يمنحك هذا تقريبًا العامل M - بالنسبة لمظاهر M للكلمة في النص، فإنها ستظهر مرة واحدة في العنوان.الآن، استخدم شيئًا مثل M*3.هذا، بالطبع، إرشادي منطقي، ومن الأفضل أن تكرره على القيم.يرى "تصحيح مشكلات الصلة بالبحث" الخاصة بشركة Grant Ingersoll لإجراء مناقشة أكثر تنظيماً.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top