K表示具有指定的簇内距离的簇

时间:2018-03-13 03:00:50

标签: python machine-learning k-means

我经常遇到这样一种情况,即我在整个城市映射了大量不同的地址(Lat Long中的输入数据)。我需要做的是使用群集这些位置,允许我指定群集中任意两点之间的最大距离"。换句话说,指定最大簇内距离。例如,以一种方式聚集所有单个点 - 群集中任意两点之间的最大距离为1.5KM。

1 个答案:

答案 0 :(得分:1)

我认为这种方法可行:

  1. 运行KMeans。
  2. 标记所有超出集群内距离阈值的集群。
  3. 对于每个标记的群集,在群集数据上运行KMeans,K = 2.
  4. 重复2,直到没有标记任何簇。
  5. 每个群集被分成两部分,直到没有违反群集内距离。

    另一种选择:

    1. 运行KMeans。
    2. 如果任何群集超过群集内距离阈值,请增加K并重复1。