在R中通过hclust重新排序数据

时间:2012-06-07 18:29:29

标签: r statistics

我在这里看到了这些代码:http://learnr.wordpress.com/2009/08/10/ggplot2-version-of-figures-in-lattice-multivariate-data-visualization-with-r-part-9/

hc1 <- hclust(dist(USArrests, method = "canberra"))
hc1 <- as.dendrogram(hc1)
ord.hc1 <- order.dendrogram(hc1)
hc2 <- reorder(hc1, state.region[ord.hc1])
ord.hc2 <- order.dendrogram(hc2)
region.colors <- trellis.par.get("superpose.polygon")$col
USArrests2 <- melt(t(scale(USArrests)))
USArrests2$X2 <- factor(USArrests2$X2, levels = state.name[ord.hc2])

但我在关于state.region变量的第四行中非常困惑。

有关订单的变量ord.hc1是从USArrests生成的,这似乎与state.region无关。那么为什么它使用state.region进行重新排序而不是USArrests数据框中的列?

1 个答案:

答案 0 :(得分:0)

查看state.region -

的帮助文件
?state.region

详细信息下的第一句是

R currently contains the following "state" data sets.  
Note that all data are arranged according to alphabetical 
order of the state names.

这意味着我们可以在USA数据集之间跳转,因为它们都是相同顺序,即USArrests的第一个条目的状态与state.region中的州。