应用错误收集

因变量在Kmeans聚类中的作用

时间：2019-07-01 12:22:15

标签： machine-learning cluster-analysis k-means

我的数据中有两个相互依赖的变量。我需要对数据集执行K均值聚类;执行k均值聚类之前是否需要丢弃一个变量，否则两个变量都可以作为输入该算法。任何帮助都是非常有意义的。

2 个答案:

答案 0 :(得分：0)

如果这种关系非常牢固，那么从字面上看就没有什么不同。

您为什么不尝试并比较结果呢？有区别吗？

答案 1 :(得分：-1)

没有必要将其缩小为一维，因为您只有2个变量。但是，如果您没有获得良好的结果，建议您使用PCA或TSNE，然后对转换后的数据使用KMEANS。但这一切都取决于您的课程问题。