如何选择零件数量PCA scikitliear

时间:2018-12-16 12:26:21

标签: python scikit-learn pca decomposition

我正在尝试使用PCA分解列。

我在选择我的方式时遇到了一些困难 使用scikit的功能PCA的n_components在python中学习。 我做到了

sc = StandardScaler()
Z = sc.fit_transform(X)
pca = PCA(n_components = 5')

能请你解释一下。

1 个答案:

答案 0 :(得分:3)

没有答案可以概率1告诉您什么是正确的组件数量。它是特定于应用程序的。

但是,您可以使用以下启发式方法。 您可以绘制解释的方差比率,并选择“捕获”至少95%的方差的组件。 在下面的示例中,捕获大约95%的方差的组件数约为30-35。

pca = PCA().fit(digits.data)
plt.plot(np.cumsum(pca.explained_variance_ratio_))
plt.xlabel('number of components')
plt.ylabel('cumulative explained variance')

enter image description here