应用错误收集

根据定义，主成分会尝试捕获数据中最高的变异;重要的是，这里的变化被定义为第二范数; 不是方差而不是标准偏差;

例如，第一个主成分是指定方向的数据的线性组合：

这很重要因为

如果分析受到解释因素的位置和规模的影响，至少存在两个问题：

但是，普通的PCA对规模和位置很敏感;例如，这是对具有相关性.4的二维标准正态变量的PCA分析;

pca1

红线代表加载矢量的方向;显然，第一个主要组成部分是捕获联合数据中的最高变化，并正确地给予每个向量相等的份额;

但是，如果我们将人口2个单位向右移动，情况会发生巨大变化; （相当于将第一个向量的平均值增加2个单位）：

pca2

从技术上讲，我们拥有与以前相同的数据，但现在第一个主要组成部分基本上捕获了第一个向量具有非零均值的事实;

类似地，如果第一个向量按比例缩放2：

pca3

可以看出，第一个向量的权重是第二个向量的4倍，只是因为它具有更高的方差。

这表明在进行PCA之前规范化规模和从数据中去除平均值的重要性;

尽管如此，仍然可以提出某些情况，即解释因素的相对位置和规模在分析中具有有用的信息，并且不应该从数据中删除它们。