سؤال

لقد رأيت بعض المواقع التي تسرد عمليات البحث ذات الصلة عند إجراء عملية بحث، وهي تقترح على وجه التحديد استعلامات بحث أخرى قد تكون مهتمًا بها.

إنني أتساءل عن أفضل طريقة لتصميم ذلك في موقع متوسط ​​الحجم (لا توجد حركة مرور كافية للاعتماد على إحصائيات الزائر لاستنتاج العلاقات).فكرتي الأولية هي تخزين أفضل 10 نتائج لكل استعلام فريد، ثم عند إجراء بحث جديد للعثور على جميع عمليات البحث التاريخية التي تطابق قدرًا ما من أفضل 10 نتائج ولكن من الناحية المثالية لا تطابقها جميعًا (قد تكون مطابقة جميعها اقتراح بحث مكافئ وبالتالي ليس مفيدًا كاقتراح).

أتصور أن بعض الأشخاص قد قاموا بهذه الوظيفة من قبل وقد يكونون قادرين على تقديم بعض الأفكار حول طرق مختلفة للقيام بذلك.أنا لا أبحث بالضرورة عن فكرة واحدة فائزة لأن الحل سيختلف بلا شك بشكل كبير حسب حجم الموقع وطبيعته.

هل كانت مفيدة؟

المحلول

هل فكرت في مصفوفة تحتوي على كلمات رئيسية على محور واحد مقابل محور واحد؟وثائق على محور آخر.بمجرد العثور على مجموعة المتجهات التي تمثل الكلمات الرئيسية، ابحث عن مجموعات من الكلمات الرئيسية الموجودة في مجموعة النتائج الأولية الخاصة بك ثم ابحث عن طريقة لتصنيف الكلمات الرئيسية الأخرى حسب عدد المستندات التي تشير إليها أو عدد المرات التي تتداخل فيها مع مجموعة النتائج الأولية .

نصائح أخرى

لقد جربت عددًا من الأساليب المختلفة لتحقيق ذلك، بدرجات مختلفة من النجاح.في النهاية، أعتقد أن النهج الأفضل يعتمد بشكل كبير على المجال/الموضوعات التي يتم البحث عنها، وكيفية قيام المستخدمين بتكوين الاستعلامات.

فكرتك حول تخزين عمليات البحث السابقة تبدو معقولة بالنسبة لي.سأكون فضوليًا لمعرفة كيفية عملها عمليًا (أعني ذلك بأكثر الطرق صدقًا - هناك العديد من الفروق الدقيقة التي يمكن أن تتسبب في فشل هذه التقنيات في "العالم الحقيقي"، خاصة عندما تكون البيانات متفرقة).

فيما يلي بعض التقنيات التي استخدمتها في الماضي، وشاهدتها في الأدبيات:

  1. النهج القائم على المعجم:قم بالفهرسة في قاموس المرادفات لكل مصطلح استخدمه المستخدم، ثم استخدم بعض الأساليب الإرشادية لتصفية المرادفات لإظهار المستخدم كمصطلحات بحث محتملة.
  2. توقف وابحث في ذلك:اقطع مصطلحات البحث (على سبيل المثال:مع ال خوارزمية بورتر الجذعية ثم استخدم المصطلحات الجذعية بدلاً من الاستعلامات المقدمة في البداية، مع إعطاء المستخدم خيار البحث عنها بالضبط المصطلحات التي حددوها (أو افعل العكس، ابحث عن المصطلحات الدقيقة أولاً، واستخدم الاشتقاق للعثور على المصطلحات التي تنبع من نفس الجذر.من الواضح أن هذا النهج الثاني يتطلب بعض المعالجة المسبقة لقاموس معروف، أو يمكنك جمع المصطلحات عندما يجدها مصطلح الفهرسة الخاص بك.)
  3. تسلسل:تحليل النتائج التي عثر عليها من خلال استعلام المستخدم واستخراج المصطلحات الأساسية من أهم نتائج N (كيا هي إحدى المكتبات/الخوارزميات التي يمكنك البحث فيها عن تقنيات استخراج الكلمات الرئيسية.)
مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top