标签: python-3.x cluster-analysis k-means
我有一个超过20列的数据集。我想找出最重要的两个变量。怎么做?
答案 0 :(得分:0)
蛮力方法是尝试所有380种可能性。
非强力方法可以尝试使用19个功能(共20个解决方案)对您的群集进行聚类,并保留最佳功能,然后再删除一个,然后从19个功能中选择最佳...最多两个类。