最大尺寸有限的聚类

时间:2012-07-20 00:19:27

标签: machine-learning cluster-analysis hierarchical-clustering

我想聚集一些数据点,但每个群集的最大点数是有限的。因此每个群集的最大大小。那有什么聚类算法吗? 我也可以定义自己的尺​​寸功能。例如,我不想将群集中的点数视为其大小,而是想要对群集中所有点的列进行求和。

3 个答案:

答案 0 :(得分:1)

快速而非最佳解决方案是迭代地将数据分成两部分,直到数据的数量受到限制。

答案 1 :(得分:0)

由于群集通常会尝试使群集尽可能大,因此这不再是群集。更像是最小生成树,您可以删除最长边以查找组。

你可以尝试类似x-means的东西,即k-means变体,你可以将你认为太大的簇分开。

答案 2 :(得分:0)

本文讨论了具有最小尺寸约束的k均值聚类问题:

Bradley,P。S.,K。P. Bennett和Ayhan Demiriz。 “受约束的k均值聚类。” Microsoft Research,Redmond(2000):1-8。

但是,本文提出的方法可以很容易地扩展到最大大小约束。

Here是此算法的一种实现,是对该算法的扩展,它解决了最小大小最大大小约束。

AS关于自定义大小函数的问题,这将是一个更难的问题,我猜本地搜索方法更合适。