应用错误收集

时间：2014-02-04 17:15:00

标签： matlab math statistics

我正在matlab中手工计算协方差（不使用cov函数）。无论如何，我很困惑为什么以及何时通过N或N-1标准化。我已经获得了2x400的样本数据。因此，两个变量和400个样本。任何人都可以解释何时某种规范化是合适的还是略微主观的？感谢

答案 0 :(得分：1)

在得到的估计量是无偏的意义上，N-1的归一化是“正确的”。这意味着如果样本数量变为无穷大，则协方差估计值接近真正的协方差。

如果你将N标准化，估计会（略微）降低噪音但是有偏差，即如果N接近无穷大则给出错误的结果。

注意，以上仅适用于您不知道平均值的情况：如果您知道平均值，则N的归一化是正确的（当然，您也必须在公式中插入正确的方法）。

答案 1 :(得分：0)

为了估计方差，使用N-1而不是N具有校正估计偏差的目的。请参阅示例here。对于协方差，我想这是同样的想法。