最近Twitter 宣布 你可以近似等级的任何给定的twitter用户精度高的输入自己的追随者数量在下面的公式:

exp($a+$b*日志(follower_count))

其中$a=21$b=为-1.1

这显然是一个很大比效率更高分类的整个清单的用户的追随者数用于指定的用户。

如果你有一个类似的数据设置,从一个不同的社会网站,如何能获得的值$a and$b,以适应这些数据设置的?基本上有些名单的频率分布的,它假定为以权力的法律。

有帮助吗?

解决方案

你有下列模式:

y = exp(a + b.log(x))

这相当于:

log(y) = a + b.log(x)

因此,如果采取日志的数据集,你结束了一种线性模型,所以你可以那么使用 线性回归 确定最适合的价值 ab.

然而,这一切听起来很无意义我的。谁说,鉴于联网网站确定用户的排名使用这种关系?

其他提示

您可以使用名为“Solver”的 Microsoft Excel 加载项。它包含在 Excel 中,但默认情况下并不总是安装。在您的 Excel 版本中查找“加载项”和“求解器”并加载它。

安装插件后,执行以下操作:

  1. 创建一个新工作表。在 A 列中,您可以输入每个人的 ID(可选)

  2. B 列,关注者数量。

  3. 如果数据未排序,则使用 B 列对其进行排序。

  4. 在 C 列上放置排名(你知道,1、2、3 等)

  5. 将值 21 放入单元格 D1,将 -1.1 放入单元格 E1。这些是 $A 和 $B 的 Twitter 值。这些是我们的基本价值观。他们可能会改变。

  6. 在单元格 D2 中输入如下公式:=exp($E$1+$F$1*log(B2))

  7. 将公式复制到数据末尾的 D2 处。

  8. 在单元格 E2 中输入一个公式,将实际排名与公式结果(即方差)进行比较。例如,=sqrt(c2*c2+d2*d2)。实际值与预测值越接近,该值就会趋于0。

  9. 将单元格 E2 复制到数据末尾。

  10. 在数据底部的 E 列中,对方差求和。例如,假设您的数据有 10,000 个值。在单元格 E10001 中输入 =sum(e2:e10000)。

  11. 转到菜单“数据”,然后查找“求解器”菜单位置。该位置可能很大程度上取决于您的 Excel 版本。使用“帮助”工具搜索 Goal Seek。

  12. 按照“帮助”中的说明(我现在必须走了)来使用求解器加载项。显然,变化的单元格是D1和E1,目标是使E10001(方差之和)尽可能接近于零。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top