我的样本为160.平均值为262,标准差为165.正态分布曲线很好,从大约-200(平均-3 *偏差)到近800(平均值+ 3 *偏差)。在下一步,我要看95%的置信区间。对于这个例子,我在excel中使用了函数CONFIDENCE,它说这个inteval是[236,287]。
我的问题是 - 为什么这个范围这么小?每本书陈述并显示95%置信区间为大约+/- 2 * st.dev。在我的情况下远离它。对此有什么解释?如此小的范围可能非常具有欺骗性。
感谢您的评论 加斯珀
答案 0 :(得分:5)
你正在混淆两件事:
正态分布95%的值均在+/- 2标准差范围内
给出样本均值,真实均值的置信区间是多少。 Excel告诉你真实平均值有95%的可能性在236到287之间。随着样本数量的增加,这个置信区间会变得更紧密(有关详细信息,查找中心极限定理)
置信度函数的Excel文档还有一些explanation
答案 1 :(得分:0)
采样N(u,s²)单独正态分布的采样数据,n个样本的平均分布为N(u,s²/ n)。也就是说,样本的平均值具有标准偏差s / sqrt(n)。
excel函数假定它给出了单个观测值的分布参数并计算了n个样本的平均值的预期分布,因此它计算s / sqrt(n)= 165 / sqrt(160)约13并且即2-sigma-interval。
答案 2 :(得分:0)
置信区间是根据标准误差计算的,这不是熟悉的标准偏差(好吧,不管怎么说)。用于计算标准误差的公式取决于所测量的度量(例如,在这种情况下的平均值,可能是另一个中的Cohen的d),通用公式是“标准偏差除以样本大小的平方根”。这在上面的答案中引用,但它被称为标准偏差。
我认为从技术上讲,标准错误只是估算器方差的平方根的名称,因此无论是否称为标准差是错误的或并非超出我的专业知识,但如果您尝试计算置信区间,则最常见的是根据标准错误来定义它们。我最近自己遇到了这个问题,因为我使用上面给出的公式来表示标准误差,但它不是Cohen标准误差的正确公式......