应用PCA后原始功能的重要性

时间:2019-08-19 14:49:23

标签: python machine-learning statistics pca

假设我有5个特征A,B,C,D,E。

我将PCA应用于数据以将维数减少到3。这意味着现在我具有3个主要组件,其中每个PC都是一个新变量。现在,我想知道A,B,C,D,E中哪个特征最重要,哪个是第二重要特征,依此类推以及增加多少(例如得分)。

我知道第一台PC具有最高的方差(重要性),其次是2nd,其次是3rd,依此类推,但是我想要原始特征A,B,C,D,E中的重要性。是否有任何方法可以找到吗?

1 个答案:

答案 0 :(得分:1)

PCA的排名标准是每列的方差,如果您希望获得排名,您可以执行的是输出各列的VarianceThreshold。你可以这样做

from sklearn.feature_selection import VarianceThreshold

selector = VarianceThreshold()
selector.fit_transform(dataframe)
print(selector.variances_)