应用错误收集

改进k均值聚类

时间：2011-01-10 14:53:20

标签： algorithm machine-learning computer-vision k-means

我关于计算机视觉的讲义提到，如果我们知道集群的标准偏差，那么k-means聚类算法的性能可以提高。怎么会这样？

我的想法是，我们可以使用标准差来首先通过基于直方图的分割来提出更好的初始估计。你怎么看？谢谢你的帮助！

1 个答案:

答案 0 :(得分：15)

您的讲师可能会考虑2002 paper by Veenman et al。基本思想是您设置每个群集中允许的最大差异。您从与数据点一样多的集群开始，然后通过
“进化”集群

如果生成的聚类的方差低于阈值
，则合并相邻聚类
如果群集的方差高于阈值
，则隔离“远”的元素
或在相邻群集之间移动一些元素（如果它减少平方误差的总和）

（这种演变充当全局优化程序，并防止初始分配集群的不良后果意味着你有k-means）

总而言之，如果您知道方差，您就知道群集的变化程度，因此更容易实现。检测异常值（通常应该放入不同的簇中）。

相关问题

改进k均值聚类

WEKA K-Means聚类

K表示群集初始化

ELKI - k-means聚类。

K均值聚类

比较k-means聚类

使用K-means进行聚类

绘图K-Means聚类

Python K意味着聚类

K表示聚类

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？