使用R Smashing the Stack for Fun and Profit包,我已经获得了一个"代码"显示码本向量的图。
我想问一下,相邻节点的码本向量是不是应该相似?为什么左边的前2个节点如此不同?
有没有办法在一个有意义的组织中组织它,如下图所示?来自Kohonen的来源。高贫困国家集中在底层。
library("kohonen")
data("wines")
wines.sc <- scale(wines)
set.seed(7)
wine.som <- som(data = wines.sc, grid = somgrid(5, 4, "hexagonal"))
# types of plots
plot(wine.som, type="codes", main = "Wine data")
答案 0 :(得分:1)
映射1是每个节点的平均向量结果。您突出显示的前2个节点非常相似。
Map 2是节点之间的一种相似性索引。
如果您想使用地图1结果获得此类地图,您可能需要使用以下参数开发自己的绘图功能:
选择最相关的节点或最不相同的节点(手动或自动)。然后,您必须将颜色归属于每个节点。
使用所选节点中每个节点中心之间的平均距离为邻居节点提供颜色。较短的距离=近色,较高的距离=褪色。
总而言之,这几乎没有什么工作。地图1更好,包含很多信息。地图2看起来不错......