我正在尝试生成多个变量的组中位数的水平点图。对于下面的虚拟数据,我希望每个变量(x,y,z,w)都有一条“线”,并在每条线上绘制七个组中位数,并按颜色区分。任何帮助表示感谢,谢谢!
library(dplyr)
dat=data.frame(x=runif(100,1,10),y=runif(100,1,5),z=runif(100,1,15),
w=runif(100,1,20),grp=sample(LETTERS[1:7],100,replace=T))
dat_summ=dat %>% group_by(grp)%>%
summarise_all(funs(median(., na.rm = TRUE)))
类似这样的东西
x|_______A_____B____C_D__EF_G
y|_______C_D_E_____F__________B____A_G
z|etc.
w|etc.
|
|
|
|
|____________________________________________________________________
| | | |
5 10 15 20
答案 0 :(得分:1)
您可以使用geom_segment
(每组找到max
的值到现在的终点,并且它们都从同一位置(最小)开始)来划行。
有点混乱,但实际数据看起来会更好。
library(tidyverse)
data_Let <- gather(dat_summ, wxyz, value, x:w)
data_Seg <- summarise(group_by(data_Let, wxyz), MAX = max(value))
ggplot(data_Let) +
geom_segment(aes(x = min(data_Let$value), xend = MAX,
y = wxyz, yend = wxyz), data_Seg) +
geom_point(aes(value, wxyz, color = grp)) +
geom_text(aes(value, wxyz, label = grp), vjust = -0.5, size = 3) +
scale_y_discrete(limits = rev(sort(unique(data_Let$wxyz)))) +
labs(x = "Median")