Frage

Twitter vor kurzem angekündigt , dass Sie den Rang eines beliebigen Twitter-Nutzer annähern kann mit hohe Genauigkeit durch ihre Mitläufer Zahl in der folgenden Formel Eingabe:

  

exp ($ a + $ b * log (FOLLOWER_COUNT))

Dabei steht $ a = 21 und $ b = -1,1

Das ist natürlich viel effizienter als die gesamte Liste der Benutzer durch Folger Anzahl für einen bestimmten Benutzer zu sortieren.

Wenn Sie eine ähnliche Datensatz aus einer anderen sozialen Seite haben, wie könnte ableiten Sie die Werte für $ a und $ b, dass die Datenmenge zu passen? Grundsätzlich einige Liste von Frequenzen die Verteilung von denen angenommen wird, Potenzgesetz sein.

War es hilfreich?

Lösung

Sie haben das folgende Modell:

y = exp(a + b.log(x))

, die gleich ist:

log(y) = a + b.log(x)

Wenn Sie also Protokolle des Datensatz nehmen, am Ende mit einem linearen Modell, so dass Sie dann lineare Regression die am besten passenden Werte von a und b bestimmen.

Allerdings klingt das alles ziemlich sinnlos für mich. Wer ist zu sagen, dass eine bestimmte Netzwerk-Site-Benutzer Rang mit dieser Art von Beziehung bestimmt?

Andere Tipps

Sie können die Microsoft Excel-Add-in namens "Solver" verwenden. Es ist mit Excel enthalten, aber nicht immer standardmäßig installiert. Suchen Sie nach "Add-In" und "Solver" in Ihrer Excel-Version und laden Sie es.

Nach der Installation des Add-In, gehen Sie wie folgt vor:

  1. Erstellen Sie ein neues Arbeitsblatt. In Spalte A würden Sie die ID jedes einzelnen (optional)

  2. put
  3. Spalte B die Zahl der Anhänger.

  4. Wenn die Daten nicht sortiert ist, sortieren sie mit Spalte B.

  5. Auf Spalte C put-Ranking (Sie wissen, 1, 2, 3, usw.)

  6. Setzen Sie Wert 21 an der Zelle D1, und -1.1 auf Zelle E1. Das sind die Twitter-Werte für $ A und $ B. Das sind unsere Grundwerte. Sie werden möglicherweise geändert werden.

  7. Bei der Zelle D2 eine Formel so: = exp ($ E $ 1 + $ F $ 1 * log (B2))

  8. Kopieren auf die Formel bei D2 am Ende der Daten.

  9. an der Zelle gesetzt E2 eine Formel, um die tatsächliche Ranking mit dem Ergebnis der Formel zu vergleichen (das heißt, Varianz). z.B. = sqrt (c2 * c2 + d2 * d2). Je näher die tatsächlichen und die vorhergesagten Werte, wird der Wert auf 0 neigen.

  10. Kopieren unten Zelle E2 bis zum Ende der Daten.

  11. Am unteren Ende der Daten in Spalte E, summiert die Varianzen. Beispiel Angenommen, Ihre Daten 10.000 Werte haben. Bei Zelle E10001 eingeben = Summe. (E2: E10000)

  12. Zum Menü Daten und suchen Sie nach dem „Solver“ Menüort. Der Standort kann auf Ihrer Version von Excel sehr abhängig. Verwenden Sie die „Hilfe“ -Funktion für Tor zur Suche suchen.

  13. Folgen Sie den Anweisungen (ich muss jetzt gehen) in der Hilfe des Add-In Solver zu verwenden. Offensichtlich sind die veränderbaren Zellen D1 und E1, und das Ziel ist E10001 (die Summe der Varianzen) so nahe bei Null wie möglich zu machen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top