消除用户评分中的偏差

时间:2017-10-23 15:25:56

标签: normalization mean standard-deviation rating-system

我有一个用户对图像评分的数据集。我正在使用均值 - 标准差归一化来对评级进行标准化,以消除由于用户特定偏好而导致的数据集中的偏差。这是处理偏见的正确方法,还是有其他方法可以消除用户评级中的偏见。

1 个答案:

答案 0 :(得分:1)

这在以下几点肯定是错误的:

  • 如果你以这种方式通过标准偏差“输入”输入,那么你所说的“低变异性并不重要,只有异常值真正计算” - 因为异常值本身的偏差大于标准的......
  • 您正在处理用户满意度的“投票”,而不是“测量”。根据定义,偏见是关于满意度的信息 - 你把它扔掉了。即150年前人们常常发现“没有狗,没有爱尔兰”的东西是可以接受的,这些日子并没有那么多。如果你想预测一家餐馆在访问后可能会被认为有多好,你不能仅仅因为人们反对这个标志而打折0星级投票!

当涉及到星级评分作为对“享受”或“后悔”某事的可能性的预测时,您可能希望阅读本文:https://www.evanmiller.org/how-not-to-sort-by-average-rating.html

请注意,链接文章主要是建模“给定过去评级,当前投票是否表明:(a)过去'满意'的延续,(b)增加'满意'的转变趋势,(c)在明星奖励方面,“满意度”逐渐降低的趋势。