我有一组包含6000个变量的数千条记录。我正在用橙色表演PCA,只保留10个第一组件。
当绘制得到的特征向量时,我发现它们似乎非常相关。因此,我将相关小部件用于计算成对相关性。它给了我很高的相关绝对值(more than 0.2 and up to 0.7)
以下是橙色流程:
(CSV) -data-> (PCA) -EigenVectors-> (Transpose) -Data-> (Correlations)
问题是为什么我的特征向量相关?
如果有人知道这是从哪里来的,那会让我放心。
非常感谢,
答案 0 :(得分:0)
PCA特征向量构成标准正交基。然而,这并不意味着它们是不相关的。
例如,3D中的标准单位矢量([1,0,0],[0,1,0],[0,0,1])都与系数-0.5相关。