Pregunta

anunció que se puede aproximar el rango de cualquier usuario de twitter dada con alta precisión mediante la introducción de su recuento de seguidor en la siguiente fórmula:

  

exp ($ a + $ b * log (FOLLOWER_COUNT))

donde $ a = 21 y $ b = -1,1

Esto es obviamente mucho más eficiente que la clasificación de toda la lista de usuarios por conteo de seguidores de un usuario determinado.

Si usted tiene unos datos similares establecidos desde un sitio social diferente, ¿cómo podría derivar los valores de $ ay $ b para adaptarse a ese conjunto de datos? Básicamente alguna lista de frecuencias de la distribución de las cuales se supone que es la ley de potencia.

¿Fue útil?

Solución

Usted tiene el siguiente modelo:

y = exp(a + b.log(x))

que es equivalente a:

log(y) = a + b.log(x)

Por lo tanto, si se toman los registros del conjunto de datos, usted termina con un modelo lineal, por lo que puede utilizar regresión lineal para determinar los valores de mejor ajuste de a y b.

Sin embargo, todo esto suena bastante sentido para mí. ¿Quién puede decir que un sitio de redes dado determina el rango de usuario que utiliza este tipo de relación?

Otros consejos

Se podría utilizar el complemento de Microsoft Excel en el llamado "Solver". Se incluye con Excel, pero no siempre instalado de forma predeterminada. Busque "add-in" y "solucionador" en su versión de Excel y cargarlo.

Después de instalar el complemento, haga lo siguiente:

  1. Crear una nueva hoja de cálculo. En la columna A que pondría el id de cada uno (opcional)

  2. individuo
  3. La columna B, el número de seguidores.

  4. Si los datos no están ordenados, clasificar usando la columna B.

  5. En la columna C Ponga la clasificación (ya saben, 1, 2, 3, etc.)

  6. valor de 21 en la celda D1 y -1,1 en la celda E1 Ponga. Esos son los valores de Twitter para $ A y B $. Esos son nuestros valores de base. Que posiblemente van a cambiar.

  7. En la celda D2 puso una fórmula como la siguiente: = exp ($ E $ 1 + $ F $ 1 log * (B2))

  8. Copiar por la fórmula en D2 al final de los datos.

  9. En la celda E2 puso una fórmula para comparar la clasificación con el resultado de la fórmula (es decir, la varianza) real. por ejemplo, = sqrt (c2 * c2 + d2 * d2). Cuanto más cerca de ser los valores predichos real y, el valor tenderá a 0.

  10. Copiar abajo celda E2 hasta el final de los datos.

  11. En la parte inferior de los datos, en la columna E, suma de las varianzas. por ejemplo, digamos que sus datos tienen 10.000 valores. En celular E10001 introduzca = suma. (E2: E10000)

  12. Ir al menú de datos, y el aspecto de la "Solver" ubicación del menú. La ubicación puede variar dependiendo de su versión de Excel. Utilizar la función de "ayuda" para buscar Buscar objetivo.

  13. Siga las instrucciones (tengo que ir ahora) en Ayuda para utilizar el complemento Solver. Obviamente, las celdas cambiantes son D1 y E1, y el objetivo es hacer E10001 (la suma de las varianzas) tan cerca de cero como sea posible.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top