为什么我的特征向量在PCA之后非常相关

时间:2014-11-07 13:15:36

标签: correlation pca orange

我有一组包含6000个变量的数千条记录。我正在用橙色表演PCA,只保留10个第一组件。

当绘制得到的特征向量时,我发现它们似乎非常相关。因此,我将相关小部件用于计算成对相关性。它给了我很高的相关绝对值(more than 0.2 and up to 0.7)

以下是橙色流程:

(CSV) -data-> (PCA) -EigenVectors-> (Transpose) -Data-> (Correlations)

问题是为什么我的特征向量相关?

如果有人知道这是从哪里来的,那会让我放心。

非常感谢,

1 个答案:

答案 0 :(得分:0)

PCA特征向量构成标准正交基。然而,这并不意味着它们是不相关的。

例如,3D中的标准单位矢量([1,0,0],[0,1,0],[0,0,1])都与系数-0.5相关。