سؤال

للعثور على المواضيع الشائعة، أستخدم النتيجة القياسية مع المتوسط ​​المتحرك:

z-score = ([current trend] - [average historic trends]) / [standard deviation of historic trends]

(شكرا جزيلا لك، نيكوز)

وحتى الآن أفعل ذلك على النحو التالي:

مهما كان الوقت، بالنسبة للاتجاهات التاريخية، فأنا ببساطة أعود 24 ساعة إلى الوراء.بافتراض أن لدينا 12 يناير، الساعة 3:45 مساءً الآن:

current_trend = عدد الزيارات [11 يناير، 3:45 - 12 يناير، 3:45]

historial_trends = الزيارات [10 يناير، 3:45 - 11 يناير، 3:45] + النتائج [9 يناير، 3:45 - 10 يناير، 3:45] + الزيارات [8 يناير، 3:45 - 9 يناير، 3: 45] + ...

ولكن هل هذا كاف حقا؟ألن يكون من الأفضل أن أبدأ دائمًا في الساعة 00:00؟على سبيل المثال بهذه الطريقة لنفس البيانات (3:45 مساءً):

current_trend = النتائج [11 يناير، 0:00 - 12 يناير، 0:00]

التاريخية_الاتجاهات = النتائج [10 يناير، 0:00 - 11 يناير، 0:00] + النتائج [9 يناير، 0:00 - 10 يناير، 0:00] + النتائج [9 يناير، 0:00 - 9 يناير، 0: 0] + ...

أنا متأكد من أن النتائج ستكون مختلفة.ولكن ما هو النهج الذي سيعطيك نتائج أفضل؟

أتمنى أن تكون قد فهمت سؤالي ويمكنك مساعدتي.:) شكرا لك مقدما!

هل كانت مفيدة؟

المحلول

أعتقد أن المشكلة التي قد تراها في تطبيقك الحالي هي أن المواضيع التي كانت ساخنة قبل 23 ساعة تؤثر على تصنيفاتك الآن.المشكلة التي أراها في تطبيقك الجديد المقترح هي أنك تمسح كل شيء في منتصف الليل، لذا فإن المواضيع التي كانت ساخنة في وقت متأخر من الليلة الماضية لن تبدو مثيرة في وقت مبكر من صباح اليوم التالي (ولكن ينبغي لها ذلك).

أقترح عليك النظر في تنفيذ خوارزمية على غرار Digg حيث تتضاءل أهمية الموضوع مع تقدم العمر.يمكنك القيام بذلك عن طريق حساب النتائج/الساعة لكل فترة من فترات الـ 24 ساعة الماضية ثم تقسيم كل نتيجة فترة على عدد الساعات التي مضت على حدوث الفترة.أضف الفترات الـ 24 للحصول على النتيجة.

درجة الحرارة = (النتيجة 24 / 24) + (النتيجة 23 / 23) + ...+ (النتيجة 2 / 2) + النتيجة 1

حيث تشير النتيجة 24 إلى عدد "الزيارات" التي حصل عليها الموضوع خلال فترة الساعة الواحدة التي حدثت قبل 24 ساعة (ربما ليست النتائج بالضبط، ولكن النتيجة التي تمت تسويتها لتلك الساعة).

بهذه الطريقة، سيتم احتساب المواضيع التي كانت رائجة قبل 24 ساعة في الخوارزمية، ولكن ليس بنفس كثافة المواضيع التي كانت رائجة قبل ساعة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top