在SOM中收集和组织数据后,如何识别群集?
(项目使用许多特征进行聚合和聚类 - 超过10个)
具体来说,我想找到群集的“中心” - 因此给我“中心”节点。
答案 0 :(得分:6)
您可以使用相对较小的地图并将每个节点视为一个群集,但这远非最佳。如果您想应用自动群集检测方法,您一定要阅读
Clustering of the Self−Organizing Map
并搜索类似的参考书目。
您还可以使用更复杂的SOM算法版本(多级,自我增长等)。
在任何情况下,请记住,找到“正确”数量的群集的问题没有一个有限的解决方案。
答案 1 :(得分:4)
据我所知,SOM主要是数据驱动的维度降低和数据压缩方法。所以它不会集群为您提供数据;它实际上可能倾向于在投影中传播聚类(即将它们分成多个单元格)。
但是,它可能适用于某些数据集:
然后在转换的数据上运行常规聚类算法。
答案 2 :(得分:3)
虽然一个老问题我遇到了同样的问题而且我已经成功实施了Estimating the Number of Clusters in Multivariate Data by Self-Organizing Maps,所以我想我会分享。
链接算法使用U矩阵突出显示各个聚类的边界,然后使用称为分水岭的图像处理算法来识别组件。为了使其正常工作,u矩阵中的区域需要在量化分辨率内凹入(当转换为二进制图像时,只需使用填充来识别区域)。