我想聚集一些数据点,但每个群集的最大点数是有限的。因此每个群集的最大大小。那有什么聚类算法吗? 我也可以定义自己的尺寸功能。例如,我不想将群集中的点数视为其大小,而是想要对群集中所有点的列进行求和。
答案 0 :(得分:1)
快速而非最佳解决方案是迭代地将数据分成两部分,直到数据的数量受到限制。
答案 1 :(得分:0)
由于群集通常会尝试使群集尽可能大,因此这不再是群集。更像是最小生成树,您可以删除最长边以查找组。
你可以尝试类似x-means的东西,即k-means变体,你可以将你认为太大的簇分开。
答案 2 :(得分:0)
本文讨论了具有最小尺寸约束的k均值聚类问题:
Bradley,P。S.,K。P. Bennett和Ayhan Demiriz。 “受约束的k均值聚类。” Microsoft Research,Redmond(2000):1-8。
但是,本文提出的方法可以很容易地扩展到最大大小约束。
Here是此算法的一种实现,是对该算法的扩展,它解决了最小大小和最大大小约束。
AS关于自定义大小函数的问题,这将是一个更难的问题,我猜本地搜索方法更合适。