标签: python cluster-analysis k-means feature-selection
我有一个3000行和50列(功能)的数据集。我计划使用K-means来聚集样本。我知道50个特征中,有些是相关的,有些是无用的。我知道我可以使用PCA来减少其尺寸,但我也知道如何找出最重要的功能。
是否有算法可以告诉我哪些功能最重要?