hc1 <- hclust(dist(USArrests, method = "canberra"))
hc1 <- as.dendrogram(hc1)
ord.hc1 <- order.dendrogram(hc1)
hc2 <- reorder(hc1, state.region[ord.hc1])
ord.hc2 <- order.dendrogram(hc2)
region.colors <- trellis.par.get("superpose.polygon")$col
USArrests2 <- melt(t(scale(USArrests)))
USArrests2$X2 <- factor(USArrests2$X2, levels = state.name[ord.hc2])
但我在关于state.region
变量的第四行中非常困惑。
有关订单的变量ord.hc1
是从USArrests
生成的,这似乎与state.region
无关。那么为什么它使用state.region
进行重新排序而不是USArrests
数据框中的列?
答案 0 :(得分:0)
查看state.region
-
?state.region
详细信息下的第一句是
R currently contains the following "state" data sets.
Note that all data are arranged according to alphabetical
order of the state names.
这意味着我们可以在USA数据集之间跳转,因为它们都是相同顺序,即USArrests
的第一个条目的状态与state.region
中的州。