假设我们使用给定的数据集训练自组织图(SOM)。对SOM的神经元而不是原始数据点进行聚类是否有意义?读完this paper后,我的疑问浮出水面,其中指出:
此过程最重要的好处 是计算量大大减少了, 有可能对大型数据集进行聚类并考虑多个 在有限的时间内使用不同的预处理策略。自然, 仅当使用SOM找到集群时,该方法才有效 与原始数据相似。
在this answer中明确指出,SOM不包括聚类,但是在对SOM进行训练之后,可以对SOM进行一些聚类过程。我认为这意味着在SOM的神经元上进行了聚类,从某种意义上说,它们是原始数据的映射,但是我不确定。所以,我想知道的是:
答案 0 :(得分:0)
是的,通常的方法似乎是分层的或k均值的(您需要对此进行初步研究-从您链接的论文中可以看出,许多变体包括稍后将在神经元上探索两级方法。如果您认为SOM是一种量化和投影技术,那么所有这些方法都可以有效使用。
它更便宜,因为它们只有二维,欧几里得数,并且点数少得多。因此,这完全符合您的来源。
请注意,SOM神经元可能是空的,它位于两个极为分开的簇之间。