使用k均值聚类比较2个Cluster解决方案

时间:2012-04-23 13:42:07

标签: r cluster-analysis k-means

我是第一次尝试在R中进行群集,并且一直在线查看基本的R帮助,并尝试比较2个群集解决方案的结果。

我复制并粘贴脚本时要小心,确保我先正确地命名了相关数据集,但不断收到我不理解的错误信息。

有什么想法吗?

脚本很简单:

比较2个集群解决方案

library(fpc)
cluster.stats (d, fit1$cluster, fit2$cluster)

我收到的错误信息是:

> library(fpc)
> cluster.stats(d, fit1$cluster, fit2$cluster)
Error in as.matrix.dist(d) : 
  length of 'dimnames' [1] not equal to array extent
In addition: Warning messages:
1: In as.dist.default(d) : NAs introduced by coercion
2: In as.dist.default(d) : non-square matrix
3: In as.matrix.dist(d) :
  number of items to replace is not a multiple of replacement length

由于

1 个答案:

答案 0 :(得分:0)

d对象应包含距离矩阵(通常是对角矩阵,对角线为零)。在R中可以使用

获得距离矩阵
d <- dist(clustering_result)