Domanda

annunciato che si può approssimare il rango di un determinato utente Twitter con elevata precisione inserendo il loro conteggio follower nella seguente formula:

  

exp ($ a + $ b log * (FOLLOWER_COUNT))

dove $ a = 21 e $ b = -1.1

Questo è ovviamente molto più efficiente di smistamento l'intero elenco di utenti dal conte seguace per un determinato utente.

Se si dispone di un set di dati simili da un sito di social diverso, come si potrebbe ricavare i valori di $ ae $ b per adattare quel set di dati? Fondamentalmente qualche lista di frequenze la cui distribuzione si presume essere la legge di potenza.

È stato utile?

Soluzione

Hai il seguente modello:

y = exp(a + b.log(x))

che è equivalente a:

log(y) = a + b.log(x)

Quindi, se si prende i registri del vostro set di dati, si finisce con un modello lineare, in modo da poter poi usare regressione lineare per determinare i valori di best-fit di a e b.

Tuttavia, questo tutti i suoni abbastanza privo di significato per me. Chi può dire che un dato sito di networking determina User Rank utilizza questo tipo di rapporto?

Altri suggerimenti

Si potrebbe utilizzare il Microsoft Excel add-in chiamato "Risolutore". E 'incluso con Excel, ma non sempre installato per impostazione predefinita. Cercare "add-in" e "risolutore" alla vostra versione di Excel e caricarlo.

Dopo aver installato il componente aggiuntivo, procedere come segue:

  1. Crea un nuovo foglio di lavoro. In colonna A si dovrebbe mettere l'id di ogni individuo (opzionale)

  2. Colonna B, il numero di seguaci.

  3. Se i dati non sono ordinati, specie utilizzando la colonna B.

  4. Sulla colonna C mettere classifica (si sa, 1, 2, 3, ecc.)

  5. valore 21 a cella D1, e -1.1 a cella E1 Put. Questi sono i valori di Twitter per $ A e $ B. Questi sono i nostri valori di base. Saranno eventualmente modificare.

  6. In cella D2 messo una formula come questo: = exp ($ E $ 1 + $ F $ 1 log * (B2))

  7. Copia giù per la formula in D2 alla fine dei dati.

  8. Alla cella E2 si inserisce una formula per confrontare la classifica con il risultato della formula (cioè, varianza) reale. ad esempio, = sqrt (c2 * c2 + d2 * d2). Il più vicino sono il reale e i valori previsti, il valore tenderà a 0.

  9. Copia giù cella E2 alla fine dei dati.

  10. In fondo i dati, a colonna E, somma le varianze. per esempio, diciamo che i dati ha 10.000 valori. Alla cella E10001 immettere = somma. (E2: E10000)

  11. Vai al menu Dati, e cercare il "Risolutore" posizione del menu. La posizione può molto a seconda della versione di Excel. Utilizzare la funzione di "Help" per la ricerca di Ricerca obiettivo.

  12. Segui le istruzioni (devo andare ora) in Guida per utilizzare il componente aggiuntivo Risolutore. Ovviamente, le celle variabili sono D1 e E1, e l'obiettivo è quello di rendere E10001 (la somma delle varianze) il più vicino possibile allo zero.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top