我想请您指出一个方向,让我可以使用适当的工具和功能来解决问题。我有一个很大的单元格网格(200k +),每个单元格都有一个索引和一定的值,例如某个单元格具有ID=2050
和value=5500
。
我想做的是找到一组单元格,这些单元格的值之和符合特定条件,例如SUMvalues = 15000
给出了单元格之间的距离条件,这意味着条件必须考虑两个变量:质心之间的距离和单元格的值。
两个相邻的单元格就可以满足条件,但是如果有一些不相邻的单元格(如下图所示)怎么办? 我正在看有关使用Python用K均值聚类的教程,但是我还不太乐观。您还有其他建议吗?
e
答案 0 :(得分:0)
这是约束优化问题,而不是聚类问题。 K-均值等将不允许您指定值约束。
正确地制定目标函数(可接受的接近值)和约束条件(值限制),并尝试使用求解器解决此类问题。
通常这些都是NP难题,因此您只能负担得起一个好的解决方案,而不是最好的解决方案。需要贪婪的策略来减少运行时间。