应用错误收集

时间：2018-08-10 10:52:18

标签： python datagrid grid cluster-computing cluster-analysis

我想请您指出一个方向，让我可以使用适当的工具和功能来解决问题。我有一个很大的单元格网格（200k +），每个单元格都有一个索引和一定的值，例如某个单元格具有ID=2050和value=5500。

我想做的是找到一组单元格，这些单元格的值之和符合特定条件，例如SUMvalues = 15000给出了单元格之间的距离条件，这意味着条件必须考虑两个变量：质心之间的距离和单元格的值。

两个相邻的单元格就可以满足条件，但是如果有一些不相邻的单元格（如下图所示）怎么办？我正在看有关使用Python用K均值聚类的教程，但是我还不太乐观。您还有其他建议吗？

答案 0 :(得分：0)

这是约束优化问题，而不是聚类问题。 K-均值等将不允许您指定值约束。

正确地制定目标函数（可接受的接近值）和约束条件（值限制），并尝试使用求解器解决此类问题。

通常这些都是NP难题，因此您只能负担得起一个好的解决方案，而不是最好的解决方案。需要贪婪的策略来减少运行时间。