使用dist()获得R中聚类分析的树状图

时间:2015-03-31 16:02:45

标签: r cluster-computing

我在名称data1上有一个数据框,如下所示

  pc month1 month2 ...
1  A     12      1
2  B      3      3
3  C      2     56
4  D     13      8

pc有274行,有85列(从pc到month84)。我的数据代表我居住城市的每个邮政编码(由pc-column表示)的用水需求。我想要做的是找到群集,我可以在一段时间内(从第1个月到第84个月)将具有相同需求特征的不同邮政编码分组。我使用下面的dist()来获得一个dis-similarity矩阵,但我一直都会遇到错误。

d<-dist(as.matrix(data1),method="euclidean")

Warning message:
In dist(data1, method = "euclidean") : NAs introduced by coercion

之后,我打算使用这样的东西来获得所需的树形图

hc<-hclust(d)
plot(hc)

有什么建议吗?

0 个答案:

没有答案