我有一个问题需要了解sklearn的PCA方法中的最大组件数。文档说如果没有指定数字,它将选择:
n_components == min(n_samples, n_features)
现在让我们考虑一个例子:
我有一个包含100个数据值和3000个特征的矩阵,得到一个大小为100 x 3000的矩阵。相应的协方差矩阵应该有3000 x 3000的大小,根据这个,应该存在3000个可能的特征值。
现在的问题是:为什么组件的最大值始终是较小的样本和特征数,在本例中为100,即使我将3000指定为参数?