假设我对10个人进行了调查,询问是否将电影评为0到4星。允许的答案是0,1,2,3和4.
平均值是2.0星。
如何计算此2.0星评级的确定性(或不确定性)?理想情况下,我想要一个介于0和1之间的数字,其中0代表完全不确定性,1代表完全确定性。
似乎很明显,10人选择的情况(2,2,2,2,2,2,2,2,2)将是最确定的,而10人选择的情况( 0,0,0,0,0,4,4,4,4,4)是最不确定的。 (0,1,1,2,2,2,3,3,4)会在中间的某个地方。
答案 0 :(得分:6)
标准差没有要求的属性。当每个人都选择相同的答案时它为零,当有五个0和五个4时,它可以与sqrt(40/9)= 2.11一样大。
我建议你使用1-stdev(x)/ sqrt(40/9),当每个人都同意时它将取值1,当有5个0和5个4时取值为0。
答案 1 :(得分:3)
您在此之后的功能是standard deviation。
三个例子的标准偏差为0(表示没有偏差),2.1(大偏差)和1.15(介于两者之间)。
答案 2 :(得分:0)
您想要的是standard deviation。
答案 3 :(得分:0)
您应该考虑平均值是否适合此类信息。即一部电影的评级是2星,是一颗四星评级的两倍吗?
通过使用百分位度量(例如中位数)来表示集中趋势,以及用于衡量“确定性”的百分位数范围(例如IQR),可能会更好。正如在上面的答案中,确定性最大值为0,因为您实际上是在测量偏离中心趋势。
顺便说一下,对10人进行的调查太小,无法通过有意义的统计分析来实现。