三维平面中的聚类点

时间:2015-11-11 23:19:02

标签: python cluster-analysis k-means

假设我们在一个立方体中有1000个随机数据点(如下图所示)。 X和Y方向上的点分布是均匀的,但不是Z方向。随着我们越来越深入,数据点越来越密集。在python中是否有任何直接的方法来聚集这些数据点:

  • 每个群集的大小相同
  • 每个群集由本地点组成,即每个群集由彼此靠近的点组成。

我已经尝试过Scipy软件包中的K-means集群,但它没有给我一个好的结果,每个集群的要点非常普遍而不是集中。

enter image description here

1 个答案:

答案 0 :(得分:0)

尝试使用Scikit-Learn的实施。他们使用一种名为" K-Means ++"的技术初始化他们的集群。它以概率方式选择第一种方法以获得最佳的起始分布。这样可以获得更好的结果。

http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html