我不明白PCA的一点。 PCA会返回最大化每个要素差异的指示吗?我的意思是,它将返回原始空间的每个特征的一个组件,并且只有k
个最大的组件将用作新子空间的轴吗?所以实际上,如果我在50-D和49个特征有很强的变化,我可以传递到49-D空间?我当然用简单的英语说话,没有正式或技术性的。
由于
答案 0 :(得分:3)
如果原始数据有50个维度,则PCA将返回50个主要组件。您可以选择可以解释最大方差的那些主成分的子集k
,通常至少为方差的90%。您使用的PCA软件通常会计算每个主成分解释的方差,因此只需加上方差并选择可以使您达到总方差的90%的顶部k
。见PCA tutorial:
一般来说,我们想选择最小的K,使得0.85到 解释了总方差的0.99(相当于85%至95%),其中这些值来自PCA最佳实践。
......当我们说PCA可以减少维数时,我们指的是PCA 可以计算主成分,用户可以选择最小的成分 它们的数量K解释了0.95的方差。一个主观的 当K相对于原始K较小时,结果令人满意 特征数量D.