识别SOM中的集群(自组织映射)

时间:2012-10-25 18:31:24

标签: cluster-analysis som

在SOM中收集和组织数据后,如何识别群集?

(项目使用许多特征进行聚合和聚类 - 超过10个)

具体来说,我想找到群集的“中心” - 因此给我“中心”节点。

3 个答案:

答案 0 :(得分:6)

您可以使用相对较小的地图并将每个节点视为一个群集,但这远非最佳。如果您想应用自动群集检测方法,您一定要阅读

Clustering of the Self−Organizing Map

并搜索类似的参考书目。

您还可以使用更复杂的SOM算法版本(多级,自我增长等)。

在任何情况下,请记住,找到“正确”数量的群集的问题没有一个有限的解决方案。

答案 1 :(得分:4)

据我所知,SOM主要是数据驱动的维度降低数据压缩方法。所以它不会集群为您提供数据;它实际上可能倾向于在投影中传播聚类(即将它们分成多个单元格)。

但是,它可能适用于某些数据集:

  • 不是处理完整数据集,而是仅在SOM节点上工作(按分配给它们的元素数量加权),这应该要小得多
  • 不是在原始空间中工作,而是在SOM所代表的低维空间中工作

然后在转换的数据上运行常规聚类算法。

答案 2 :(得分:3)

虽然一个老问题我遇到了同样的问题而且我已经成功实施了Estimating the Number of Clusters in Multivariate Data by Self-Organizing Maps,所以我想我会分享。

链接算法使用U矩阵突出显示各个聚类的边界,然后使用称为分水岭的图像处理算法来识别组件。为了使其正常工作,u矩阵中的区域需要在量化分辨率内凹入(当转换为二进制图像时,只需使用填充来识别区域)。