Question

我正在尝试使用来自scikit-learn的PCA进行降维。我的数据集有大约300个样本和4096个特征。我想将尺寸减小到400和40.但是当我调用算法时，结果数据最多只有＆＃34;样本数量＆＃34;特征

from sklearn.decomposition import PCA

pca = PCA(n_components = 400)
trainData = pca.fit_transform(trainData)
testData = pca.transform(testData)

trainData的初始形状为300x4096，结果数据形状为300x300。有没有办法对这类数据执行此操作（很多功能，几个样本）？

Answer 1

可以从中提取的主要组件的最大数量和M x N数据集是min（M，N）。它不是算法问题。从根本上说，这是最大数量。