我正在尝试了解PCA。我有一个三维数据集,我建立了两个PCA模型,一个有2个组件,另一个有3个组件。但是,我不明白为什么两种PCA模型的解释差异比率是相同的。
Model with 2 components: [ 0.60792494 0.31234679]
Model with 3 components: [ 0.60792494 0.31234679 0.07972828]
答案 0 :(得分:2)
如果您使用的数据对于两个模型都相同,那么您是否使用所有可能的组件,解释的方差比应该总和为1.在您的实例中,前两个组件解释了~91%的变化。由于每个PCA组件与之前的组件正交,因此您添加的任何其他组件将仅解释尚未解释的方差。因此,3组分模型的前2个组分将解释与2组分模型相同的量,第3个组分将解释另外8%的变化。
你正在使用python,也许是一个很好的直观介绍,例子可以在http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html
中找到