Question

我已经进行了聚类分析，因此我得到了，让我们说4个不同的聚类。使用$ kcmem，我可以看到哪个站属于哪个群集。但是我想从每个群集中挑出一个站点并进一步分析它。

我得到了这个结果（它只有一个测试，我有超过6个站点）。我挑出了4个集群。

$kcmem
     4 5
[1,] 1 1
[2,] 2 2
[3,] 3 3
[4,] 3 3
[5,] 4 4
[6,] 4 5

当然我想选择每个群集中最典型的站点。我怎么做？从主要组件分析我知道实际上有一个加载列表，你可以看到一个站与一个组有多大关系。

我只能认为$ kccentroids？但是，同一群集中的所有站点都具有相同的值。

$kccentroids
     [,1]      [,2]      [,3]      [,4]      [,5]      [,6]
4 1.0000000 0.5043308 0.7270394 0.7269328 0.6742015 0.6782120
4 0.5043308 1.0000000 0.5465914 0.5685687 0.6443715 0.5181649
4 0.7269861 0.5575801 0.9541015 0.9541015 0.8253911 0.8108125
4 0.6762068 0.5812682 0.7937889 0.8424147 0.9630949 0.9630949

有人可以帮忙吗？我需要一个命令来显示一个站属于某个群集的原因，以便我可以选择每个群集的1个站点作为＆＃34;主要示例＆＃34;。

Answer 1

选择距群集质心最近的工作站。

这将是KMeans的常用方法。

如果您使用PAM（k medoids）或亲和传播或极小极大等算法，那么这些方法自然会提供群集代表。

R - 识别＆＃34; Prime示例＆＃34;在群集分析中

1 个答案: