如何在python中聚类多维数据集?

时间:2018-04-19 05:49:00

标签: machine-learning cluster-analysis pca

我一直在使用sklearn的kmeans和DBSCAN算法对具有2个特征的数据集进行聚类。我必须对具有非常高维度的数据进行聚类,比如800-900我想知道如何尽可能准确地实现它。

P.S:经过一些搜索后,我意识到可以应用PCA进行降维,但我想知道在其他任何库中是否还有其他方法,如果不是sklearn。

1 个答案:

答案 0 :(得分:0)

可以在高维数据上运行KMeans和DBSCAN。

此外,重要的是内在维度。一个900维数据集,其中898维度为常数0,其行为与二维数据集完全相同(好吧,它可能需要450倍的长度,但这是预期的。)