Sklearn PCA是pca.components_的负载?

时间:2016-04-03 00:16:02

标签: python scikit-learn pca

Sklearn PCA是pca.components_的负载?我很确定它是,但我正在尝试跟随研究论文,我从他们的负载得到不同的结果。我无法在sklearn文档中找到它。

2 个答案:

答案 0 :(得分:9)

pca.components_是投影数据的空间的正交基础。它的形状为(n_components, n_features)。如果要保留包含100个样本和50个维度(也称为要素)的数据集的前三个组件(例如,执行三维散点图),pca.components_将具有形状(3, 50)

我认为你所谓的“加载”是每个样本投影到组件跨越的向量空间的结果。这些可以在致电pca.transform(X_train)后致电pca.fit(X_train)获得。结果将具有形状(n_samples, n_components),即前一个示例中的(100, 3)

答案 1 :(得分:0)

除了负载之外,先前的答案基本上是正确的。正如问问者最初指出的那样,components_实际上是负载。 fit_transform函数的结果将为您提供主要成分(变换/缩小的矩阵)。