PCA:首先是中心还是先进行标准化?

时间:2012-01-29 10:12:01

标签: regression linear pca eigenvector eigenvalue

如果我有一个协方差矩阵,并且我想执行相应相关矩阵的PCA,我应该首先将协方差矩阵中心化,然后标准化(除以std偏差)或者我首先将协方差矩阵标准化,然后意味着 - 中心然后执行PCA?为什么呢?

1 个答案:

答案 0 :(得分:1)

PCA中标准化步骤的要点是将数据集的质心设置为0.只有先减去均值然后除以标准推导才能实现。

想想如果你颠倒这两个步骤将会发生什么:一个精确处于平均值的数据点不会在你的标准化坐标系的原点结束,因为你要先将它除去,然后再减去它。

编辑:如果您计算并减去已标准化数据点的平均值,则顺序无关紧要。