我的数据集包含25个变量和112095个观测值。
我试图绘制一个包含5个变量的图形。
在图像中,您可以看到我在1列中有日期,第2列中的过程类型,上限列4,下限列3,测量值第5列。
我想绘制每个过程的测量值,并绘制线上限和下限。在示例数据集中我只显示了3个进程,但实际上我有14个进程,我想在一个面板上显示它们。 下面是样本图片,
谁能帮助我,我怎么能从这开始呢?我是R和ggplot的新人。
编辑: 对于1个进程,这是示例图,它应该看起来像
例如,从图表中可以看出,1个过程中,不同颜色的内部点是测量值,顶部和下部的绿线为下限和上限,不同颜色的点表示不同的天数(thur,fri,sat)。
答案 0 :(得分:1)
使用一些随机数据
library(lubridate)
library(dplyr)
library(ggplot2)
df <- data.frame(date = as.Date(c("2018-05-04", "2018-05-06", "2018-09-04", "2018-09-07")),
process = c("P1", "P1", "P2", "P2"),
lower_bound = c(0.5, 0.5, 2.5, 2.5),
upper_bound = c(2.5, 2.5, 3.7, 3.7),
mv = c(1, 2, 3, 3.2)) %>%
mutate(wd = wday(date))
ggplot(df) +
geom_jitter(aes(x = wd, y = mv, col = as.factor(wd)), width = 0.1) +
geom_line(aes(x = wd, y = lower_bound), colour = 'green') +
geom_line(aes(x = wd, y = upper_bound), colour = 'green') +
facet_wrap(~process, ncol = 3)