标签: machine-learning cluster-analysis k-means
我的数据中有两个相互依赖的变量。我需要对数据集执行K均值聚类;执行k均值聚类之前是否需要丢弃一个变量,否则两个变量都可以作为输入该算法。任何帮助都是非常有意义的。
答案 0 :(得分:0)
如果这种关系非常牢固,那么从字面上看就没有什么不同。
您为什么不尝试并比较结果呢?有区别吗?
答案 1 :(得分:-1)
没有必要将其缩小为一维,因为您只有2个变量。但是,如果您没有获得良好的结果,建议您使用PCA或TSNE,然后对转换后的数据使用KMEANS。但这一切都取决于您的课程问题。