威尔逊五星评级的置信区间

时间:2013-10-26 23:27:32

标签: algorithm rating

Wilson的Confidence Interval分别将值设为TRUE或FALSE,或“upvotes”和“downvotes”。从这些投票中产生一个评级。

出于我的项目的目的,我认为WCI是完美的。然而,标量upvote和downvote不足以描述我评价的东西。

这就是5星评级的地方,这就是我需要有人反驳我的逻辑的地方。 现在我想,如果我要用WCI实施5星评级,那么以下内容应该可以在不破解置信区间内部的情况下工作。

对于评级小部件中的每个星,我们分配一个唯一的整数值。每个值都计为正(upvote)或负(downvote)。所以以下值将是:

1/5星:-2 2/5星:-1 3/5星:1 4/5星:2 5/5星:3

总结以上数值。 1星的最低投票被归类为2个downvotes。 2星投票被列为1投票。对于3星的中等投票,我们给1个upvote。对于4颗星,我们给出2个赞成票。对于最多5颗星,我们给出了3个赞成票。

请反驳这个逻辑,为什么这不起作用?也许这与星级评定系统的“普通人的理解”背道而驰?

3 个答案:

答案 0 :(得分:4)

很容易想到以下'解决方法'它将多级系统转换为二进制“upvote / downvote”式排名(然后可以使用Wilson得分置信区间的下限进行评分):

假设您拥有受欢迎的5星评级系统。所以我们有多个投票,每个投票的值为:1,2,3,4或5。

转换'这些评级为上/下投票,使用以下规则:

For star rating -- Add

*     - 0.00 to up votes and 1.00 to down votes (i.e. a full down vote)
**    - 0.25 to up votes and 0.75 to down votes
***   - 0.50 to up votes and 0.50 to down votes
****  - 0.75 to up votes and 0.25 to down votes
***** - 1.00 to up votes and 0.00 to down votes (i.e. a full up vote)

在我们将5星评级降低到上/下评级后,我们可以继续进行Evan Miller的文章中描述的通常评分计算。

由于我不是统计学家或数学家,我很乐意听到其他人是否有意义,以及这种方法可能存在的问题。

答案 1 :(得分:2)

首先,试着了解WCI背后的直觉。或者,甚至更简单的正态近似区间(http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval)。

所有这种区间计算背后的直觉很简单。您计算样本均值和标准差。间隔是平均值+ -z *标准。

在你的情况下,计算平均值很简单。这是评级本身的意思。假设p1是1星评级的分数,p2,...,p5。 p1 + p2 + ... + p5 = 1.并假设您使用n个样本计算这些统计数据。您的数据的平均值是1 * p1 + 2 * p2 + ... + 5 * p5。

你的数据的方差是(E(x ^ 2) - (E(x))^ 2)/ n =((p1 * 1 ^ 2 + p2 * 2 ^ 2 .. + p5 * 5 ^ 2 ) - (1 * p1 + 2 * p2 + .. + 5 * p5)^ 2)/ n

由于std = sqrt(var),因此计算正态近似区间非常简单。我会让你努力将其扩展到WCI。

答案 2 :(得分:1)

此计划的最大问题是,单个5星评级将重达3个2星评级。此外,300个3星评级(应该是平庸的评分)的项目将与具有100个5星评级(应该是完美分数)的项目具有相同的分数。

可以做的是计算每个可能得分的威尔逊置信区间。然后,每个区间的下限是该分数对(加权)平均值的权重。