主成分分析,有多少组件?

时间:2017-10-01 20:13:00

标签: machine-learning pca

我不明白PCA的一点。 PCA会返回最大化每个要素差异的指示吗?我的意思是,它将返回原始空间的每个特征的一个组件,并且只有k个最大的组件将用作新子空间的轴吗?所以实际上,如果我在50-D和49个特征有很强的变化,我可以传递到49-D空间?我当然用简单的英语说话,没有正式或技术性的。

由于

1 个答案:

答案 0 :(得分:3)

如果原始数据有50个维度,则PCA将返回50个主要组件。您可以选择可以解释最大方差的那些主成分的子集k,通常至少为方差的90%。您使用的PCA软件通常会计算每个主成分解释的方差,因此只需加上方差并选择可以使您达到总方差的90%的顶部k。见PCA tutorial

  

一般来说,我们想选择最小的K,使得0.85到   解释了总方差的0.99(相当于85%至95%),其中这些值来自PCA最佳实践。

     

......当我们说PCA可以减少维数时,我们指的是PCA   可以计算主成分,用户可以选择最小的成分   它们的数量K解释了0.95的方差。一个主观的   当K相对于原始K较小时,结果令人满意   特征数量D.