我有N
节点和K
分发中心的数据集。如果我知道他们各自的(x,y)坐标
我可以使用什么算法来聚类这些节点以保持平衡 在距离节点中心和分配给的节点数之间 中心?
例如,我可以使用作为标准,将节点分配到最近的分布中心,但这可能会生成具有多个节点的分发中心,我想避免这种情况。有什么帮助吗?
答案 0 :(得分:1)
将此表示为优化问题。
E.g。当N分配给同一K时,平均距离和惩罚因子。
然后使用标准优化技术找到解决方案。
不要指望任何开箱即用的东西支持像你这样的模糊限制。你必须决定什么是好的解决方案,然后让优化器搜索一个好的解决方案。