祝你有个愉快的一天。请帮我。我有一个规范化的文件。该文件包含21个数字列。
我会将pca analysis
应用于此文件,如下所示:
pca = decomposition.PCA(n_components=21)
pca_output = pca.fit_transform(pca_matrix)
pca_inverse = pca.inverse_transform(pca_output)
据我所知,我赋给n_components
变量的值等于列数。但我不明白的是如何确定n_components
变量。
答案 0 :(得分:1)
这是一个超参数,找到最佳值取决于您对数据的处理方式。让我描述3种可能的用途:
n_components=None
)。然后检查属性explained_variance_ratio_
并确定您愿意放弃多少。或者你可以放n_components='mle'
并让数据为你决定。n_components
和预测模型的超参数上找到最佳的n_components。