我有一些数据,我想做一个PCA情节。然而,前两个主要成分完全是由于3个异常样本(32个中),我想跳过这些,只是从第3个开始绘制主成分。这是可能的,还是我必须做一些计算从数据中减去前两个主成分然后绘制剩余部分?
答案 0 :(得分:5)
如果异常值占据了你的pca,并且你不想要这个,我强烈建议你在执行你的pca之前删除它们。
答案 1 :(得分:4)
除去异常值的另一种方法是通过使用稳健的方法拟合PCA来减轻其影响或影响。 R具有广泛的稳健统计方法。请参阅Robust task view on CRAN中的“多变量分析”项目符号。