Question

我正在处理的数据是一个聚类数据，在一个组中有多个观察，我生成了一个毛虫图并希望为每个组标记（zipid），而不是每一行，我当前的图形和代码如下所示：< / p>

  text = hosp_new[,c("zipid")]
  ggplot(hosp_new, aes(x = id, y = oe, colour = zipid, shape = group)) +
  # theme(panel.grid.major = element_blank()) +
  geom_point(size=1) +
  scale_shape_manual(values = c(1, 2, 4)) +
  geom_errorbar(aes(ymin = low_ci, ymax = high_ci)) +
  geom_smooth(method = lm, se = FALSE) +
  scale_linetype_manual(values = linetype) +
  geom_segment(aes(x = start_id, xend = end_id, y = region_oe, yend = region_oe, linetype = "4", size = 1.2)) +
  geom_ribbon(aes(ymin = region_low_ci, ymax = region_high_ci), alpha=0.2, linetype = "blank") +
  geom_hline(aes(yintercept = 1, alpha = 0.2, colour = "red", size = 1), show.legend = "FALSE") +
  scale_size_identity() +
  scale_x_continuous(name = "hospital id", breaks = seq(0,210, by = 10)) +
  scale_y_continuous(name = "O:E ratio", breaks = seq(0,7, by = 1)) +
  geom_text(aes(label = text), position = position_stack(vjust = 10.0), size = 2)

卡特彼勒情节：

caterpillar plot

每种颜色代表一个区域，我只需要一个标签/每个区域，但不知道如何删除此图中的重复标签。有什么想法吗？

Answer 1

关键是让geom_text仅为每个zipid返回一个值，而不是多个值。如果我们希望每个zipid标签位于其组的中间，那么我们可以使用id的平均值作为每个标签的x坐标。在下面的代码中，我们使用stat_summaryh（来自ggstance包）计算标签x坐标的平均id值，并为每个{{1}返回一个标签}}。

zipid

如@ user20650所述，您也可以使用分面。在下面的代码中，library(ggplot2) theme_set(theme_bw()) library(ggstance) # Fake data set.seed(300) dat = data.frame(id=1:100, y=cumsum(rnorm(100)), zipid=rep(LETTERS[1:10], c(10, 5, 20, 8, 7, 12, 7, 10, 13,8))) ggplot(dat, aes(id, y, colour=zipid)) + geom_segment(aes(xend=id, yend=0)) + stat_summaryh(fun.x=mean, aes(label=zipid, y=1.02*max(y)), geom="text") + guides(colour=FALSE)删除了构面板之间的空间，而panel.spacing.x=unit(0,'pt')在每个面板的两侧添加了0.5个填充单元。它们共同确保刻度线之间的间距恒定，甚至可以跨越刻面。

expand=c(0,0.5)

R图：按组标签

1 个答案: