用python查找集群

时间:2018-08-10 10:52:18

标签: python datagrid grid cluster-computing cluster-analysis

我想请您指出一个方向,让我可以使用适当的工具和功能来解决问题。我有一个很大的单元格网格(200k +),每个单元格都有一个索引和一定的值,例如某个单元格具有ID=2050value=5500

我想做的是找到一组单元格,这些单元格的值之和符合特定条件,例如SUMvalues = 15000给出了单元格之间的距离条件,这意味着条件必须考虑两个变量:质心之间的距离和单元格的值。

两个相邻的单元格就可以满足条件,但是如果有一些不相邻的单元格(如下图所示)怎么办? 我正在看有关使用Python用K均值聚类的教程,但是我还不太乐观。您还有其他建议吗?

Cluster example

e

1 个答案:

答案 0 :(得分:0)

这是约束优化问题,而不是聚类问题。 K-均值等将允许您指定值约束。

正确地制定目标函数(可接受的接近值)和约束条件(值限制),并尝试使用求解器解决此类问题。

通常这些都是NP难题,因此您只能负担得起一个好的解决方案,而不是最好的解决方案。需要贪婪的策略来减少运行时间。