我已经进行了聚类分析,因此我得到了,让我们说4个不同的聚类。使用$ kcmem,我可以看到哪个站属于哪个群集。但是我想从每个群集中挑出一个站点并进一步分析它。
我得到了这个结果(它只有一个测试,我有超过6个站点)。我挑出了4个集群。
$kcmem
4 5
[1,] 1 1
[2,] 2 2
[3,] 3 3
[4,] 3 3
[5,] 4 4
[6,] 4 5
当然我想选择每个群集中最典型的站点。我怎么做?从主要组件分析我知道实际上有一个加载列表,你可以看到一个站与一个组有多大关系。
我只能认为$ kccentroids?但是,同一群集中的所有站点都具有相同的值。
$kccentroids
[,1] [,2] [,3] [,4] [,5] [,6]
4 1.0000000 0.5043308 0.7270394 0.7269328 0.6742015 0.6782120
4 0.5043308 1.0000000 0.5465914 0.5685687 0.6443715 0.5181649
4 0.7269861 0.5575801 0.9541015 0.9541015 0.8253911 0.8108125
4 0.6762068 0.5812682 0.7937889 0.8424147 0.9630949 0.9630949
有人可以帮忙吗?我需要一个命令来显示一个站属于某个群集的原因,以便我可以选择每个群集的1个站点作为"主要示例"。
答案 0 :(得分:1)
选择距群集质心最近的工作站。
这将是KMeans的常用方法。
如果您使用PAM(k medoids)或亲和传播或极小极大等算法,那么这些方法自然会提供群集代表。