我正在matlab中手工计算协方差(不使用cov函数)。无论如何,我很困惑为什么以及何时通过N或N-1标准化。我已经获得了2x400的样本数据。因此,两个变量和400个样本。任何人都可以解释何时某种规范化是合适的还是略微主观的?感谢
答案 0 :(得分:1)
在得到的估计量是无偏的意义上,N-1的归一化是“正确的”。这意味着如果样本数量变为无穷大,则协方差估计值接近真正的协方差。
如果你将N标准化,估计会(略微)降低噪音但是有偏差,即如果N接近无穷大则给出错误的结果。
注意,以上仅适用于您不知道平均值的情况: 如果您知道平均值,则N的归一化是正确的(当然,您也必须在公式中插入正确的方法)。
答案 1 :(得分:0)
为了估计方差,使用N-1而不是N具有校正估计偏差的目的。请参阅示例here。对于协方差,我想这是同样的想法。