输入一个固定的集群质心,找到N个其他(python)

时间:2016-11-11 17:10:21

标签: python-2.7 scikit-learn cluster-analysis

我有一张lat的货运目的地表,很长。我有一个固定的起点(也是lat,long)。我想使用聚类找到其他最佳原点位置。换句话说,我想分配一个集群质心(保持固定)并找到1,2,3。 。 。 N个其他聚类质心。 scikit learn cluster module可以实现吗?

1 个答案:

答案 0 :(得分:0)

不是为此回收群集,而是将其视为常规优化问题。您不希望“发现结构”,而是优化成本。

要注意地球不平坦,欧几里德距离(即k均值)是一个坏主意。向北1度仅在赤道大约相同的距离到1度以东。如果您的数据是在纽约,你有一个不可忽略的失真,你的解决方案甚至不是局部最优。

如果你绝对坚持滥用kmeans,那很容易做到。

随机选择n-1个中心和预定义的中心。 然后只运行1次k-means迭代。然后再次将该中心替换为所需的中心。重复下一次迭代。