Pergunta

Twitter recentemente anunciado que você pode aproximar a classificação de qualquer usuário do Twitter com alta precisão, inserindo sua contagem de seguidores na seguinte fórmula:

Exp ($ A + $ B * log (Follower_Count))

onde $ a = 21 e $ b = -1,1

Obviamente, isso é muito mais eficiente do que classificar toda a lista de usuários por contagem de seguidores para um determinado usuário.

Se você possui um conjunto de dados semelhante de um site social diferente, como você pode derivar os valores de $ A e $ B para ajustar esse conjunto de dados? Basicamente, alguma lista de frequências cuja distribuição é considerada a lei de energia.

Foi útil?

Solução

Você tem o seguinte modelo:

y = exp(a + b.log(x))

que é equivalente a:

log(y) = a + b.log(x)

Portanto, se você pegar logs do seu conjunto de dados, acabará com um modelo linear, para que você possa usar regressão linear para determinar os valores de melhor ajuste de a e b.

No entanto, tudo isso me parece bastante sem sentido. Quem pode dizer que um determinado site de rede determina a classificação do usuário usando esse tipo de relacionamento?

Outras dicas

Você pode usar o suplemento do Microsoft Excel chamado "Solver". Está incluído no Excel, mas nem sempre instalado por padrão. Procure "suplemento" e "solucionador" na sua versão do Excel e carregue-o.

Depois de instalar o suplemento, faça o seguinte:

  1. Crie uma nova planilha. Na coluna A, você colocaria o ID de cada indivíduo (opcional)

  2. Coluna B, o número de seguidores.

  3. Se os dados não forem classificados, classifique -os usando a coluna B.

  4. Na coluna C, colocou a classificação (você sabe, 1, 2, 3, etc.)

  5. Coloque o valor 21 na célula D1 e -1,1 na célula E1. Esses são os valores do Twitter para $ A e $ B. Esses são nossos valores básicos. Eles possivelmente vão mudar.

  6. Na célula D2, coloque uma fórmula como esta: = exp ($ e $ 1+$ f $ 1*log (b2))

  7. Copie a fórmula em D2 no final dos dados.

  8. Na célula E2, coloque uma fórmula para comparar a classificação real com o resultado da fórmula (isto é, variação). por exemplo, = sqrt (c2*c2+d2*d2). Quanto mais próximos os valores reais e previstos, o valor tende a 0.

  9. Copie a célula E2 até o final dos dados.

  10. Na parte inferior dos dados, na coluna E, soma as variações. Por exemplo, digamos que seus dados tenham 10.000 valores. Na célula E10001 ENTER = SUM (E2: E10000).

  11. Vá para os dados do menu e procure o local do menu "solucionador". A localização pode dependendo da sua versão do Excel. Use a instalação "Ajuda" para procurar a busca de metas.

  12. Siga as instruções (tenho que ir agora) em ajuda para usar o suplemento do solucionador. Obviamente, as células em mudança são D1 e E1, e o objetivo é tornar o E10001 (a soma das variações) o mais próximo possível de zero.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top