自组织地图“错误”

时间:2013-03-19 15:31:00

标签: k-means som

正如我们从K-Means知道的那样,样本数据聚集在N个聚类中(每个聚类都有一个质心向量)并非所有数据都聚集在它们所属的聚类中!我的意思是一些数据向量可能聚集在错误的集群中。这意味着即使在K-Means中,聚类时也没有100%的精度。我想知道在SOM算法中是否也会发生这样的“错误”。 所以...在SOM算法收敛之后,是否有任何数据样本不属于它们实际放置的节点?

我希望我的问题很清楚。我期待着你的回答。

1 个答案:

答案 0 :(得分:0)

SOM根据显示的输入对数据进行聚类。群集的形成取决于输入呈现给网络的方式。

SOM通过最小化地图点阵中的获胜节点与实际输入向量之间的距离,然后对近邻中的权重进行调整来对输入进行聚类。因此,属于单个类的输入会映射到形成集群的同一位置。

因此,当算法收敛时,除非在以下场景中,否则不太可能发生这种情况

  1. 没有足够的数据点来训练网络
  2. 使用学习率的价值不合适
  3. SOM正确聚类,我们没有看到聚类中的常见(隐藏)功能,并且倾向于认为聚类中存在错误(发生在我身上很多次)。
  4. 我不是SOM的专家,而是从经验中回答。希望这会有所帮助。