所以基本上,我在RStudio中创建了一个大的树形图,我已经尝试了很多东西。我试图垂直绘制名称,我试图给我的dataframe-columns简单的名称,如1,2,3,...,11等。但我无法弄清楚,为什么我会得到这些奇怪的黑条?!我看不到我的变量的名字..你有什么线索吗?
答案 0 :(得分:1)
在树形图的底部,您拥有在群集中使用的所有标识符。如果你有很多标识符,那么你就无法看到它们,因为它们彼此“堆叠”在一起。这就产生了“黑条”。
library(cluster)
d = daisy(mtcars)
hc = hclust(as.dist(d), method = "ward")
你几乎无能为力。但是,您可以尝试操作cex
参数。
plot(hc, cex = 0.5)
这里我缩小了标识符的大小。
为了检索标识符,一种解决方案是执行此操作。
让我们假设我们选择3
群集的解决方案。
clusters = cutree(hc, k = 3)
然后你可以做
dt = as.data.frame(clusters)
dt$carsID = row.names(dt)
library(dplyr)
dt %>% arrange(clusters)
clusters carsID
1 1 Mazda RX4
2 1 Mazda RX4 Wag
3 1 Datsun 710
4 1 Merc 240D
5 1 Merc 230
6 1 Merc 280
7 1 Merc 280C
8 1 Fiat 128
9 1 Honda Civic
10 1 Toyota Corolla
11 1 Toyota Corona
12 1 Fiat X1-9
13 1 Porsche 914-2
14 1 Lotus Europa
15 1 Ferrari Dino
16 1 Volvo 142E
17 2 Hornet 4 Drive
18 2 Valiant
19 2 Merc 450SE
20 2 Merc 450SL
21 2 Merc 450SLC
22 2 Dodge Challenger
23 2 AMC Javelin
24 3 Hornet Sportabout
25 3 Duster 360
26 3 Cadillac Fleetwood
27 3 Lincoln Continental
28 3 Chrysler Imperial
29 3 Camaro Z28
30 3 Pontiac Firebird
31 3 Ford Pantera L
32 3 Maserati Bora
然后你可以看到所有的标识符。