scikit学习PCA降维 - 数据很多特征和少量样本

时间:2014-03-21 11:46:10

标签: python scikit-learn pca

我正在尝试使用来自scikit-learn的PCA进行降维。我的数据集有大约300个样本和4096个特征。我想将尺寸减小到400和40.但是当我调用算法时,结果数据最多只有"样本数量"特征

from sklearn.decomposition import PCA

pca = PCA(n_components = 400)
trainData = pca.fit_transform(trainData)
testData = pca.transform(testData)

trainData的初始形状为300x4096,结果数据形状为300x300。有没有办法对这类数据执行此操作(很多功能,几个样本)?

1 个答案:

答案 0 :(得分:3)

可以从中提取的主要组件的最大数量和M x N数据集是min(M,N)。它不是算法问题。从根本上说,这是最大数量。