如何对向量组进行聚类?

时间:2019-04-14 11:55:01

标签: cluster-analysis

我大约有1000个矢量,每个矢量都有9000个数值。我需要一些方法来找到它们之间的相似之处或将它们聚类。这样做的方法/算法是什么? 我考虑过k均值,但是它可以用于这样的数据吗? 预先感谢。

1 个答案:

答案 0 :(得分:-1)

在如此高的维数(9000)中,您很有可能遭受维数的诅咒,我建议在以如此高的维数使用聚类算法之前,先运行降维算法(例如PCA或T-SNE)尺寸。

您可以阅读有关降维技术here

的更多信息

您还可以了解有关维数诅咒的更多信息,以及为什么很难在高维here上找到有意义的簇。