假设我有5个特征A,B,C,D,E。
我将PCA应用于数据以将维数减少到3。这意味着现在我具有3个主要组件,其中每个PC都是一个新变量。现在,我想知道A,B,C,D,E中哪个特征最重要,哪个是第二重要特征,依此类推以及增加多少(例如得分)。
我知道第一台PC具有最高的方差(重要性),其次是2nd,其次是3rd,依此类推,但是我想要原始特征A,B,C,D,E中的重要性。是否有任何方法可以找到吗?
答案 0 :(得分:1)
PCA
的排名标准是每列的方差,如果您希望获得排名,您可以执行的是输出各列的VarianceThreshold
。你可以这样做
from sklearn.feature_selection import VarianceThreshold
selector = VarianceThreshold()
selector.fit_transform(dataframe)
print(selector.variances_)