我有一些网页的网站上,我必须创建一个订基于"普及"/"活动"

的参数,我必须使用是:

  • 意见页
  • 意见页上(有形式的底部这里采用可以提出意见)
  • 点击了"喜欢它"图标

是否有任何标准,对于什么公式普及将是什么?(如果没有意见也很好)

(一开始我以为看法+10*评论+10*喜欢它)

有帮助吗?

解决方案

没有标准公式,为该(如何可能有?)

你有什么看起来像一个相当正常的解决方案,并可能会很好的工作。当然,你应该玩的10找到值得满足你的需要。

根据你的要求,则可能还需要添加一个时间因素(即-X点每周)使老页变得不受欢迎的。或者,你可以改变你的"页面浏览"以"页面浏览的最后一个月"。再次,这取决于你的需要,它不可能是相关的。

其他提示

你能做些什么像什么 YouTube上的 不会-只有按最大数每一类别。例如,大多数看,大多数评论说,最喜欢的。在每一类不同的网页可以来第一,尽管排名可能可能是相关的。如果你只需要一个单一的排名,然后你就要拿出一个公式的某种优选来根据经验通过分析一堆数据您已经有,并决定什么应当被计算为好坏和逆向工作配合的一个公式适合你的决定。

你甚至可以尝试一个机学习的方法"学习"有什么好的加权是相结合的每一个这些数字作为你的例的公式。做手工可能还不会太难。

我用,

(C*comments + L*likeit)*100/views

在那里你必须使用的C和L取决于你的价值每个属性。我用C=1和L=1个。

这给你百分比的风景产生积极行动,使得项目 更高百分比的大多数的"流行"。我喜欢这个,因为它使得能够对新的项目是很受欢迎第一,显示了第一和得到更多的意见和因此成为不受欢迎的(或更多),直到稳定。

无论如何, 我希望这有所帮助。PS:它将工作一样,而"*100"但是我喜欢的百分比。

实际上有一个公认的最佳方式计算:
http://www.evanmiller.org/how-not-to-sort-by-average-rating.html

你可能需要结合'喜欢'和'意见'为单一的分数,分配自己的加权因素的每一个,前插入式作为'积极投票的价值。

从上面的链接:

这是你=下限Wilson,这是你的置信区间为一个 伯努利参数

我们需要以平衡的比例正收视率 不确定性的数量少的意见。幸运的是, 数学是出于1927年通过埃德温*B威尔逊。我们想要什么 要问的是: 给出的评级,我有,有95%的机会 "真正的"分积极的评级至少为什么? 威尔逊给的 答案。考虑到只有积极和负面的评级(即不是一个 5星级的比例),下往上的正面评级的比例 给出: enter image description here

(使用中减去它说,加/减计算的下限。) 在这里, 是的 观察到的 分积极的评级, zα/2 是的 (1-α/2) 分位数的标准的正态分布 n 是的 总数的评级。同样的公式实施的红宝石:

require 'statistics2'

def ci_lower_bound(pos, n, confidence)
    if n == 0
        return 0
    end
    z = Statistics2.pnormaldist(1-(1-confidence)/2)
    phat = 1.0*pos/n
    (phat + z*z/(2*n) - z * Math.sqrt((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n)
end

pos 是的数量积极的评级, n 是的总数 收视率,而信任是指统计的置信水平:挑0.95有95%的机会,你的下限是正确的,0.975 有97.5%的机会,等等。Z-这是你在此的功能永远不会 变化,所以,如果你没有统计数据包方便,或者如果 性能是一个问题您总能硬代码一个值在这里 z.(使用1.96对一的置信水平的0.95.)

同样的公式作为SQL query:

SELECT widget_id, ((positive + 1.9208) / (positive + negative) - 
                   1.96 * SQRT((positive * negative) / (positive + negative) + 0.9604) / 
                          (positive + negative)) / (1 + 3.8416 / (positive + negative)) 
       AS ci_lower_bound FROM widgets WHERE positive + negative > 0 
       ORDER BY ci_lower_bound DESC;

我会价值的意见多喜欢它如果内容邀请的讨论。如果它只是陈述事实,一个平等的口粮对意见等计数似乎是确定的(虽然10是有点太多了,我想...)

并参考虑到时间的用户花了不知怎的?你可能会使用,以及作为2第二种观点是指小于3分钟之一。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top