如何在matlab中的pca之后选择最需要的功能(变量)?

时间:2015-03-23 13:23:55

标签: matlab correlation pca

我已提到How to select top 100 features(a subset) which are most relevant after pca?

我正在使用pca()而不是princomp(),因为它已在新版本中删除。

我知道"特征值表示每个特征向量解释的数据量。选择特征的一种简单方法是选择具有最高特征值的100个特征"。

例如,如果我在matlab中运行以下内容

 [coeff,score,latent] = pca(pcaInput);

然后潜在地给我我需要的价值。

但是,潜在的是按排序顺序给出的。我怎么知道,矢量潜在的第一个值对应于我数据集中的哪个变量?

1 个答案:

答案 0 :(得分:0)

在文档中:

  

列按顺序减少组件差异。

一般来说,PCA的特征向量是从最相关到​​较少的有序,它是非书面的“标准”AFAIK。

此外,latent的第一个值对应于特征向量的第一行,当然不需要重新排序。