我在名称data1上有一个数据框,如下所示
pc month1 month2 ...
1 A 12 1
2 B 3 3
3 C 2 56
4 D 13 8
pc有274行,有85列(从pc到month84)。我的数据代表我居住城市的每个邮政编码(由pc-column表示)的用水需求。我想要做的是找到群集,我可以在一段时间内(从第1个月到第84个月)将具有相同需求特征的不同邮政编码分组。我使用下面的dist()来获得一个dis-similarity矩阵,但我一直都会遇到错误。
d<-dist(as.matrix(data1),method="euclidean")
Warning message:
In dist(data1, method = "euclidean") : NAs introduced by coercion
之后,我打算使用这样的东西来获得所需的树形图
hc<-hclust(d)
plot(hc)
有什么建议吗?