منحنى قانون الطاقة المناسب لاستفسارات الشبكة الاجتماعية

StackOverflow https://stackoverflow.com/questions/4610132

سؤال

تويتر مؤخرا أعلن يمكنك تقريب رتبة أي مستخدم معين على Twitter بدقة عالية عن طريق إدخال عدد أتباعهم في الصيغة التالية:

exp ($ a + $ b * log (follower_count))

حيث $ a = 21 و $ b = -1.1

من الواضح أن هذا أكثر كفاءة من فرز القائمة الكاملة للمستخدمين عن طريق عدد المتابعين لمستخدم معين.

إذا كان لديك مجموعة بيانات مماثلة من موقع اجتماعي مختلف ، فكيف يمكنك اشتقاق القيم لـ $ A و $ B لتناسب مجموعة البيانات هذه؟ في الأساس بعض قائمة الترددات التي يفترض أن توزيعها قانون السلطة.

هل كانت مفيدة؟

المحلول

لديك النموذج التالي:

y = exp(a + b.log(x))

وهو ما يعادل:

log(y) = a + b.log(x)

لذلك ، إذا أخذت سجلات مجموعة البيانات الخاصة بك ، ينتهي بك الأمر بنموذج خطي ، حتى تتمكن من الاستخدام بعد ذلك الانحدارالخطي لتحديد القيم الأفضل ل a و b.

ومع ذلك ، كل هذا يبدو لا معنى له بالنسبة لي. من الذي يقول إن موقع شبكات معين يحدد رتبة المستخدم باستخدام هذا النوع من العلاقة؟

نصائح أخرى

يمكنك استخدام الوظيفة الإضافية Microsoft Excel المسماة "Solver". يتم تضمينه مع Excel ، ولكن لم يتم تثبيته دائمًا بشكل افتراضي. ابحث عن "الوظيفة الإضافية" و "Solver" في إصدار Excel وتحميله.

بعد تثبيت الوظيفة الإضافية ، قم بما يلي:

  1. إنشاء ورقة عمل جديدة. في العمود (أ) ، ستضع معرف كل فرد (اختياري)

  2. العمود ب ، عدد المتابعين.

  3. إذا لم يتم فرز البيانات ، فترتبها باستخدام العمود B.

  4. في العمود C وضع الترتيب (كما تعلمون ، 1 ، 2 ، 3 ، إلخ)

  5. ضع القيمة 21 في الخلية D1 ، و -1.1 في الخلية E1. هذه هي قيم Twitter لـ $ a و $ b. هذه هي قيمنا الأساسية. ربما يتغيرون.

  6. في الخلية D2 ، ضع صيغة كهذه: = exp ($ e $ 1+$ f $ 1*log (b2))

  7. انسخ الصيغة في D2 في نهاية البيانات.

  8. في الخلية E2 ضع صيغة لمقارنة الترتيب الفعلي مع نتيجة الصيغة (أي التباين). على سبيل المثال ، = SQRT (C2*C2+D2*D2). كلما كانت القيم الفعلية والمتوقعة ، تميل القيمة إلى 0.

  9. نسخ الخلية E2 إلى نهاية البيانات.

  10. في الجزء السفلي من البيانات ، في العمود E ، قم بتلخيص الفروق. على سبيل المثال ، لنفترض أن بياناتك لديها 10000 قيمة. في الخلية E10001 أدخل = SUM (E2: E10000).

  11. انتقل إلى بيانات القائمة ، وابحث عن موقع قائمة "Solver". قد يعتمد الموقع بشدة على نسختك من Excel. استخدم مرفق "المساعدة" للبحث عن الهدف البحث.

  12. اتبع الإرشادات (يجب أن أذهب الآن) للمساعدة في استخدام الوظيفة الإضافية Solver. من الواضح أن الخلايا المتغيرة هي D1 و E1 ، والهدف هو جعل E10001 (مجموع الفروق) أقرب ما إلى الصفر.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top