PCA - 确定主要组成部分

时间:2017-09-19 19:33:47

标签: r

我正在尝试制作PCA,但我遗漏了一些东西。

计算特征值并绘制图。所以,我看到有很多组件。关键是我不知道如何确定哪些组件是主要组件......

enter image description here

1 个答案:

答案 0 :(得分:1)

这完全取决于应用程序。

  1. 如果您将PCA作为监督学习的预处理步骤,则应通过交叉验证/验证选择最佳PCA维数。

  2. 如果您使用PCA作为无监督方法来探索和可视化数据,那么有几种选择:

    • 某种差异的硬性上限解释为80%(在您的情况下,它看起来像4-5台个人应该这样做)

    • Cattell的scree测试表示在肘部开始后放下所有其他组件。 (在您的情况下应保留2台PC)

    • Kaiser标准:Kaiser规则是丢弃所有特征值低于1.0的组件(我记得Kaiser说他在那个组件上被错误引用)。

    • Horn的平行分析(是的,真的分析不是一些肘部规则) - 这里有关于如何在R中执行它的链接:https://www.r-bloggers.com/determining-the-number-of-factors-with-parallel-analysis-in-r/