我找不到我遇到的问题类型,我想知道是否有人知道它涉及的统计类型。我不确定它甚至是一种可以优化的类型。
我想优化三个变量,或者更确切地说是两者的组合。第一个是Likert刻度平均值,另一个是该项目在该刻度尺度上评级的频率,第三个是项目ID。 Likert是[1,2,3,4]
所以:
3.25,200,item1。这意味着item1被评为200次,平均得分为3.25。
我有一堆物品,我想找到价值很高的物品。例如,一个4,1的项目会很糟糕,因为它被评为最高,它只被评为一次。而1,1000也会因为相反的原因而感到沮丧。
有没有办法用简单的启发式进行优化?有人告诉我调查信心乐队,但我不确定这是怎么回事。谢谢!
答案 0 :(得分:1)
基本上,您希望忽略评分低于x
的分数,其中x
是可以根据数据差异估算的阈值。
我建议估算数据的方差(标准偏差)并在标准误差上设置一个阈值,然后将该误差转换为产生95%置信度所需的最小样本数。见:http://en.wikipedia.org/wiki/Standard_error_(statistics)
例如,如果您的数据的标准偏差为0.5,并且您希望95%确定您的分数在当前估计值的0.1之内,那么您需要(0.5 / 0.1)^ 2 = 25个评级。