因变量在Kmeans聚类中的作用

时间:2019-07-01 12:22:15

标签: machine-learning cluster-analysis k-means

我的数据中有两个相互依赖的变量。我需要对数据集执行K均值聚类;执行k均值聚类之前是否需要丢弃一个变量,否则两个变量都可以作为输入该算法。任何帮助都是非常有意义的。

2 个答案:

答案 0 :(得分:0)

如果这种关系非常牢固,那么从字面上看就没有什么不同。

您为什么不尝试并比较结果呢?有区别吗?

答案 1 :(得分:-1)

没有必要将其缩小为一维,因为您只有2个变量。但是,如果您没有获得良好的结果,建议您使用PCA或TSNE,然后对转换后的数据使用KMEANS。但这一切都取决于您的课程问题。