使用ggplot按组为多个变量创建点图

时间:2018-08-26 07:20:45

标签: r ggplot2

我正在尝试生成多个变量的组中位数的水平点图。对于下面的虚拟数据,我希望每个变量(x,y,z,w)都有一条“线”,并在每条线上绘制七个组中位数,并按颜色区分。任何帮助表示感谢,谢谢!

library(dplyr)
    dat=data.frame(x=runif(100,1,10),y=runif(100,1,5),z=runif(100,1,15),
    w=runif(100,1,20),grp=sample(LETTERS[1:7],100,replace=T))
    dat_summ=dat %>% group_by(grp)%>%
      summarise_all(funs(median(., na.rm = TRUE)))

类似这样的东西

x|_______A_____B____C_D__EF_G
y|_______C_D_E_____F__________B____A_G
z|etc.
w|etc.
 |
 |
 |
 |
 |____________________________________________________________________
    |           |            |            |
    5           10           15           20

1 个答案:

答案 0 :(得分:1)

您可以使用geom_segment(每组找到max的值到现在的终点,并且它们都从同一位置(最小)开始)来划行。

有点混乱,但实际数据看起来会更好。

library(tidyverse)
data_Let <- gather(dat_summ, wxyz, value, x:w)
data_Seg <- summarise(group_by(data_Let, wxyz), MAX = max(value))

ggplot(data_Let) +
    geom_segment(aes(x = min(data_Let$value),  xend = MAX,
                     y = wxyz, yend = wxyz), data_Seg) +
    geom_point(aes(value, wxyz, color = grp)) +
    geom_text(aes(value, wxyz, label = grp), vjust = -0.5, size = 3) +
    scale_y_discrete(limits = rev(sort(unique(data_Let$wxyz)))) +
    labs(x = "Median")

enter image description here