应用错误收集

置信区间

时间：2014-05-13 08:29:02

标签： excel math confidence-interval

我的样本为160.平均值为262，标准差为165.正态分布曲线很好，从大约-200（平均-3 *偏差）到近800（平均值+ 3 *偏差）。在下一步，我要看95％的置信区间。对于这个例子，我在excel中使用了函数CONFIDENCE，它说这个inteval是[236,287]。

我的问题是 - 为什么这个范围这么小？每本书陈述并显示95％置信区间为大约+/- 2 * st.dev。在我的情况下远离它。对此有什么解释？如此小的范围可能非常具有欺骗性。

感谢您的评论加斯珀

3 个答案:

答案 0 :(得分：5)

你正在混淆两件事：

正态分布95％的值均在+/- 2标准差范围内
给出样本均值，真实均值的置信区间是多少。 Excel告诉你真实平均值有95％的可能性在236到287之间。随着样本数量的增加，这个置信区间会变得更紧密（有关详细信息，查找中心极限定理）

置信度函数的Excel文档还有一些explanation

答案 1 :(得分：0)

采样N（u，s²）单独正态分布的采样数据，n个样本的平均分布为N（u，s²/ n）。也就是说，样本的平均值具有标准偏差s / sqrt（n）。

excel函数假定它给出了单个观测值的分布参数并计算了n个样本的平均值的预期分布，因此它计算s / sqrt（n）= 165 / sqrt（160）约13并且即2-sigma-interval。

答案 2 :(得分：0)

置信区间是根据标准误差计算的，这不是熟悉的标准偏差（好吧，不管怎么说）。用于计算标准误差的公式取决于所测量的度量（例如，在这种情况下的平均值，可能是另一个中的Cohen的d），通用公式是“标准偏差除以样本大小的平方根”。这在上面的答案中引用，但它被称为标准偏差。

我认为从技术上讲，标准错误只是估算器方差的平方根的名称，因此无论是否称为标准差是错误的或并非超出我的专业知识，但如果您尝试计算置信区间，则最常见的是根据标准错误来定义它们。我最近自己遇到了这个问题，因为我使用上面给出的公式来表示标准误差，但它不是Cohen标准误差的正确公式......