答案 0 :(得分:1)
这完全取决于应用程序。
如果您将PCA作为监督学习的预处理步骤,则应通过交叉验证/验证选择最佳PCA维数。
如果您使用PCA作为无监督方法来探索和可视化数据,那么有几种选择:
某种差异的硬性上限解释为80%(在您的情况下,它看起来像4-5台个人应该这样做)
Cattell的scree测试表示在肘部开始后放下所有其他组件。 (在您的情况下应保留2台PC)
Kaiser标准:Kaiser规则是丢弃所有特征值低于1.0的组件(我记得Kaiser说他在那个组件上被错误引用)。
Horn的平行分析(是的,真的分析不是一些肘部规则) - 这里有关于如何在R中执行它的链接:https://www.r-bloggers.com/determining-the-number-of-factors-with-parallel-analysis-in-r/