Sklearn PCA是pca.components_的负载?我很确定它是,但我正在尝试跟随研究论文,我从他们的负载得到不同的结果。我无法在sklearn文档中找到它。
答案 0 :(得分:9)
pca.components_
是投影数据的空间的正交基础。它的形状为(n_components, n_features)
。如果要保留包含100个样本和50个维度(也称为要素)的数据集的前三个组件(例如,执行三维散点图),pca.components_
将具有形状(3, 50)
。
我认为你所谓的“加载”是每个样本投影到组件跨越的向量空间的结果。这些可以在致电pca.transform(X_train)
后致电pca.fit(X_train)
获得。结果将具有形状(n_samples, n_components)
,即前一个示例中的(100, 3)
。
答案 1 :(得分:0)
除了负载之外,先前的答案基本上是正确的。正如问问者最初指出的那样,components_实际上是负载。 fit_transform函数的结果将为您提供主要成分(变换/缩小的矩阵)。