كيفية العثور على العلامات الشائعة من سلسلة البحث الطويلة

StackOverflow https://stackoverflow.com/questions/1631949

  •  06-07-2019
  •  | 
  •  

سؤال

أرغب في الحصول على علامات رائجة في موقع الويب الخاص بي وفقًا لعمليات البحث التي أجراها المستخدمون.المشكلة التي لا أرى حلاً بسيطًا لها هي كيفية استخراج المصطلحات المهمة بسهولة من سلسلة البحث.على سبيل المثال، قد يبحث العديد من المستخدمين عن "visual studio" لأغراض مختلفة.على سبيل المثال، "visual studio 2010"، "اختبار وحدة visual studio"، "مكونات نماذج ويب visual studio".وفي عمليات البحث الثلاثة هذه، كان "visual studio" هو الأكثر شيوعًا.كيف يمكن للخوارزمية أن تلاحظ أنه بما أن كلمة "visual studio" سيتم خلطها في معظم الحالات مع العديد من الكلمات الأخرى؟

شكرًا لك!

هل كانت مفيدة؟

المحلول

  1. تقسيم كل استعلام بحث إلى مجموعة من الكلمات المفردة.
  2. حساب المسافة بين الكلمات (الأقرب، الأفضل => القيمة الأعلى)
  3. أضف مسافة الكلمة هذه لكل زوج كلمات عبر جميع الاستعلامات.

أزواج الكلمات ذات القيم الأعلى هي "العلامات الشائعة" الخاصة بك.

نصائح أخرى

قم بإلقاء نظرة على مشروع Codeplex هذا

http://www.codeplex.com/TheTagCloud

يتضمن وظيفة يمكنك من خلالها تمرير ملف html كمدخل وسيقوم بإرجاع سحابة العلامات.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top