我有一个np.array,其中包含400个条目,每个条目包含具有1000个点的光谱值。 我想确定频谱的n个最有趣的索引并返回它们。因此,我可以可视化它们并将其用作分类器的输入向量。
是最好计算方差,应用PCA还是有更适合的算法? 以及如何计算该选择项的会计差异?
谢谢
答案 0 :(得分:1)
降维可以通过两种不同的广泛方式执行:feature extraction和feature selection。 PCA更适合特征提取,而“识别n个最有趣的索引”是一个特征选择问题。更多详细信息以及如何在此处进行编码:sklearn.feature_selection