我有一个数据集,其中包含每个州每年的考试成绩,并且已使用以下代码对其进行了聚类:
cluster.m4 <- na.omit(states.data, cols="AVG_MATH_4_SCORE")
d <- dist(cluster.m4$AVG_MATH_4_SCORE)
hp <- hclust(d)
plot(hp, hang = -1, labels=cluster.m4$STATE)
rect.hclust(hp, k=4, border="red")
我得到的输出看起来像这样:
现在是这样,没有简单的方法来读取标签。有没有一种方法可以让我只显示其中一个群集,以便能够读取标签?
答案 0 :(得分:2)
您可以使用统计中的cutree
将树状图分成多个部分。您可以指定
k:具有所需组数的整数标量或向量
或
h:数字标量或具有要在其中剪切树的高度的向量。
根据您的图像,我认为在15高度处进行切割会起作用:
cutree(hp, h = 15)