标签: python scikit-learn pca decomposition
我正在尝试使用PCA分解列。
我在选择我的方式时遇到了一些困难 使用scikit的功能PCA的n_components在python中学习。 我做到了
sc = StandardScaler() Z = sc.fit_transform(X) pca = PCA(n_components = 5')
能请你解释一下。
答案 0 :(得分:3)
没有答案可以概率1告诉您什么是正确的组件数量。它是特定于应用程序的。
但是,您可以使用以下启发式方法。 您可以绘制解释的方差比率,并选择“捕获”至少95%的方差的组件。 在下面的示例中,捕获大约95%的方差的组件数约为30-35。
pca = PCA().fit(digits.data) plt.plot(np.cumsum(pca.explained_variance_ratio_)) plt.xlabel('number of components') plt.ylabel('cumulative explained variance')