Question

annonciez que vous pouvez rapprocher le rang de tout utilisateur de Twitter donnée avec une grande précision en introduisant leur suiveur compte dans la formule suivante:

  

exp ($ a + log $ b * (follower_count))

où $ a = 21 et $ b = -1,1

Ceci est évidemment beaucoup plus efficace que le tri de la liste complète des utilisateurs par nombre suiveur pour un utilisateur donné.

Si vous avez des données similaires établies à partir d'un site social différent, comment pourriez-vous déduire les valeurs de $ a et $ b pour adapter cet ensemble de données? Fondamentalement, une liste des fréquences dont la distribution est supposée loi de puissance.

Était-ce utile?

La solution

Vous avez le modèle suivant:

y = exp(a + b.log(x))

qui est équivalent à:

log(y) = a + b.log(x)

Par conséquent, si vous prenez les journaux de votre ensemble de données, vous vous retrouvez avec un modèle linéaire, de sorte que vous pouvez ensuite utiliser

Autres conseils

Vous pouvez utiliser le module complémentaire dans Microsoft Excel nommé « Solver ». Il est inclus dans Excel, mais pas toujours installé par défaut. Recherchez "add-in" et "solveur" dans votre version Excel et le charger.

Après avoir installé le complément, procédez comme suit:

  1. Créer une nouvelle feuille de calcul. Dans la colonne A vous mettriez l'id de chaque individu (en option)

  2. La colonne B, le nombre d'adeptes.

  3. Si les données ne sont pas triées, les trier en utilisant la colonne B.

  4. Sur la colonne C a mis le classement (vous savez, 1, 2, 3, etc.)

  5. Mettre la valeur 21 à la cellule D1 et -1,1 à la cellule E1. Ce sont les valeurs Twitter pour $ A et B $. Ce sont nos valeurs de base. Ils éventuellement changer.

  6. A la cellule D2 mettre une formule comme ceci: = exp ($ E 1 $ + F 1 $ * log (B2))

  7. Copier vers le bas à la formule D2 à la fin des données.

  8. A la cellule E2 a mis une formule pour comparer le classement réel avec le résultat de la formule (à savoir, la variance). par exemple, = sqrt (c2 * c2 + d2 * d2). Les plus proches sont les valeurs réelles et prévues, la valeur aura tendance à 0.

  9. Copier vers le bas la cellule E2 à la fin des données.

  10. Au bas de données, à la colonne E, la somme des variances. par exemple, supposons que vos données ont 10.000 valeurs. À la cellule E10001 entrez = somme (e2: E10000).

  11. Aller aux données de menu, et rechercher l'emplacement du menu "Solver". L'emplacement peut varier en fonction de votre version d'Excel. Utilisez la fonction « Aide » à la recherche de valeur cible.

  12. Suivez les instructions (je dois aller maintenant) dans l'aide à utiliser le Solveur. De toute évidence, les cellules sont changeantes D1 et E1, et le but est de faire E10001 (la somme des variances) aussi proche de zéro que possible.

scroll top