sklearn PCA中的组件数量

时间:2017-01-23 10:25:02

标签: scikit-learn linear-algebra pca eigenvalue eigenvector

我有一个问题需要了解sklearn的PCA方法中的最大组件数。文档说如果没有指定数字,它将选择:

n_components == min(n_samples, n_features)

现在让我们考虑一个例子:

我有一个包含100个数据值和3000个特征的矩阵,得到一个大小为100 x 3000的矩阵。相应的协方差矩阵应该有3000 x 3000的大小,根据这个,应该存在3000个可能的特征值。

现在的问题是:为什么组件的最大值始终是较小的样本和特征数,在本例中为100,即使我将3000指定为参数?

0 个答案:

没有答案