如何使用自组织图对数据进行聚类?

时间:2018-09-02 14:56:50

标签: neural-network cluster-analysis data-science self-organizing-maps

假设我们使用给定的数据集训练自组织图(SOM)。对SOM的神经元而不是原始数据点进行聚类是否有意义?读完this paper后,我的疑问浮出水面,其中指出:

  

此过程最重要的好处   是计算量大大减少了,   有可能对大型数据集进行聚类并考虑多个   在有限的时间内使用不同的预处理策略。自然,   仅当使用SOM找到集群时,该方法才有效   与原始数据相似。

this answer中明确指出,SOM不包括聚类,但是在对SOM进行训练之后,可以对SOM进行一些聚类过程。我认为这意味着在SOM的神经元上进行了聚类,从某种意义上说,它们是原始数据的映射,但是我不确定。所以,我想知道的是:

  • 对训练后的神经元权重作为数据点执行聚类算法的数据进行聚类是否正确?如果没有,那么如何使用SOM完成集群?
  • 数据集通常应具有什么特征才能使这种方法有用?

1 个答案:

答案 0 :(得分:0)

是的,通常的方法似乎是分层的或k均值的(您需要对此进行初步研究-从您链接的论文中可以看出,许多变体包括稍后将在神经元上探索两级方法。如果您认为SOM是一种量化和投影技术,那么所有这些方法都可以有效使用。

它更便宜,因为它们只有二维,欧几里得数,并且点数少得多。因此,这完全符合您的来源。

请注意,SOM神经元可能是空的,它位于两个极为分开的簇之间。