我已提到How to select top 100 features(a subset) which are most relevant after pca?
我正在使用pca()而不是princomp(),因为它已在新版本中删除。
我知道"特征值表示每个特征向量解释的数据量。选择特征的一种简单方法是选择具有最高特征值的100个特征"。
例如,如果我在matlab中运行以下内容
[coeff,score,latent] = pca(pcaInput);
然后潜在地给我我需要的价值。
但是,潜在的是按排序顺序给出的。我怎么知道,矢量潜在的第一个值对应于我数据集中的哪个变量?
答案 0 :(得分:0)
在文档中:
列按顺序减少组件差异。
一般来说,PCA的特征向量是从最相关到较少的有序,它是非书面的“标准”AFAIK。
此外,latent
的第一个值对应于特征向量的第一行,当然不需要重新排序。