我正在尝试使用来自scikit-learn的PCA进行降维。我的数据集有大约300个样本和4096个特征。我想将尺寸减小到400和40.但是当我调用算法时,结果数据最多只有"样本数量"特征
from sklearn.decomposition import PCA
pca = PCA(n_components = 400)
trainData = pca.fit_transform(trainData)
testData = pca.transform(testData)
trainData的初始形状为300x4096,结果数据形状为300x300。有没有办法对这类数据执行此操作(很多功能,几个样本)?
答案 0 :(得分:3)
可以从中提取的主要组件的最大数量和M x N数据集是min(M,N)。它不是算法问题。从根本上说,这是最大数量。