Wilson的Confidence Interval分别将值设为TRUE或FALSE,或“upvotes”和“downvotes”。从这些投票中产生一个评级。
出于我的项目的目的,我认为WCI是完美的。然而,标量upvote和downvote不足以描述我评价的东西。
这就是5星评级的地方,这就是我需要有人反驳我的逻辑的地方。 现在我想,如果我要用WCI实施5星评级,那么以下内容应该可以在不破解置信区间内部的情况下工作。
对于评级小部件中的每个星,我们分配一个唯一的整数值。每个值都计为正(upvote)或负(downvote)。所以以下值将是:
1/5星:-2 2/5星:-1 3/5星:1 4/5星:2 5/5星:3
总结以上数值。 1星的最低投票被归类为2个downvotes。 2星投票被列为1投票。对于3星的中等投票,我们给1个upvote。对于4颗星,我们给出2个赞成票。对于最多5颗星,我们给出了3个赞成票。
请反驳这个逻辑,为什么这不起作用?也许这与星级评定系统的“普通人的理解”背道而驰?
答案 0 :(得分:4)
很容易想到以下'解决方法'它将多级系统转换为二进制“upvote / downvote”式排名(然后可以使用Wilson得分置信区间的下限进行评分):
假设您拥有受欢迎的5星评级系统。所以我们有多个投票,每个投票的值为:1,2,3,4或5。
转换'这些评级为上/下投票,使用以下规则:
For star rating -- Add
* - 0.00 to up votes and 1.00 to down votes (i.e. a full down vote)
** - 0.25 to up votes and 0.75 to down votes
*** - 0.50 to up votes and 0.50 to down votes
**** - 0.75 to up votes and 0.25 to down votes
***** - 1.00 to up votes and 0.00 to down votes (i.e. a full up vote)
在我们将5星评级降低到上/下评级后,我们可以继续进行Evan Miller的文章中描述的通常评分计算。
由于我不是统计学家或数学家,我很乐意听到其他人是否有意义,以及这种方法可能存在的问题。
答案 1 :(得分:2)
首先,试着了解WCI背后的直觉。或者,甚至更简单的正态近似区间(http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval)。
所有这种区间计算背后的直觉很简单。您计算样本均值和标准差。间隔是平均值+ -z *标准。
在你的情况下,计算平均值很简单。这是评级本身的意思。假设p1是1星评级的分数,p2,...,p5。 p1 + p2 + ... + p5 = 1.并假设您使用n个样本计算这些统计数据。您的数据的平均值是1 * p1 + 2 * p2 + ... + 5 * p5。
你的数据的方差是(E(x ^ 2) - (E(x))^ 2)/ n =((p1 * 1 ^ 2 + p2 * 2 ^ 2 .. + p5 * 5 ^ 2 ) - (1 * p1 + 2 * p2 + .. + 5 * p5)^ 2)/ n
由于std = sqrt(var),因此计算正态近似区间非常简单。我会让你努力将其扩展到WCI。
答案 2 :(得分:1)
此计划的最大问题是,单个5星评级将重达3个2星评级。此外,300个3星评级(应该是平庸的评分)的项目将与具有100个5星评级(应该是完美分数)的项目具有相同的分数。
你可以做的是计算每个可能得分的威尔逊置信区间。然后,每个区间的下限是该分数对(加权)平均值的权重。