通过识别重要变量来减少尺寸

时间:2018-07-26 20:06:05

标签: python pca variance dimensionality-reduction

我有一个np.array,其中包含400个条目,每个条目包含具有1000个点的光谱值。 我想确定频谱的n个最有趣的索引并返回它们。因此,我可以可视化它们并将其用作分类器的输入向量。

是最好计算方差,应用PCA还是有更适合的算法? 以及如何计算该选择项的会计差异?

谢谢

1 个答案:

答案 0 :(得分:1)

降维可以通过两种不同的广泛方式执行:feature extractionfeature selection。 PCA更适合特征提取,而“识别n个最有趣的索引”是一个特征选择问题。更多详细信息以及如何在此处进行编码:sklearn.feature_selection