使用stat_summary在分面时为折线图生成误差线的问题

时间:2017-12-09 01:46:41

标签: r ggplot2 facet summary stat

我正在尝试使用ggplot2中的stat_summary向线图添加错误栏,但是当我面对图表时它不起作用

我的数据:

    date week year location imidacloprid block wickhami virescens sexta
1 15-May    1 2015  kinston           tp     1        0         0     0
2 15-May    1 2015  kinston           gh     1        0         0     0
3 15-May    1 2015  kinston          utc     1        0         0     0
4 15-May    1 2015  kinston           gh     2        0         0     0
5 15-May    1 2015  kinston          utc     2        0         0     0
6 15-May    1 2015  kinston           tp     2        0         0     0


'data.frame':   576 obs. of  9 variables:
 $ date        : Factor w/ 27 levels "1-Jul","12-Jun",..: 4 4 4 4 4 4 4 4 4 4 ...
 $ week        : Factor w/ 12 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ year        : Factor w/ 2 levels "2015","2016": 1 1 1 1 1 1 1 1 1 1 ...
 $ location    : Factor w/ 2 levels "kinston","rocky mount": 1 1 1 1 1 1 1 1 1 1 ...
 $ imidacloprid: Factor w/ 3 levels "gh","tp","utc": 2 1 3 1 3 2 3 2 1 2 ...
 $ block       : Factor w/ 4 levels "1","2","3","4": 1 1 1 2 2 2 3 3 3 4 ...
 $ wickhami    : num  0 0 0 0 0 0 0 0 0 0 ...
 $ virescens   : num  0 0 0 0 0 0 0 0 0 0 ...
 $ sexta       : num  0 0 0 0 0 0 0 0 0 0 ...

总结图表数据:

wickhami_sum = summarySE(bug_subset_final, 
                measurevar="wickhami", 
                groupvars=c("imidacloprid","week","year"))

   imidacloprid week year N wickhami         sd          se         ci
1            gh    1 2015 8   0.0000  0.0000000  0.00000000  0.0000000
2            gh    1 2016 8   0.0000  0.0000000  0.00000000  0.0000000
3            gh    2 2015 8   0.0000  0.0000000  0.00000000  0.0000000
4            gh    2 2016 8   0.0000  0.0000000  0.00000000  0.0000000
5            gh    3 2015 8   0.0000  0.0000000  0.00000000  0.0000000
6            gh    3 2016 8   0.1250  0.2314550  0.08183171  0.1935012
7            gh    4 2015 8   0.0000  0.0000000  0.00000000  0.0000000
8            gh    4 2016 8   0.5000  0.4629100  0.16366342  0.3870025
9            gh    5 2015 8   0.5000  0.3779645  0.13363062  0.3159862

下面的代码没有给我任何问题,并生成我的数据两年合并的线图,并通过stat_summary生成错误栏

ggplot(wickhami_sum, aes(x=week, y=wickhami,linetype=imidacloprid,group=imidacloprid))+
  stat_summary(fun.data=mean_se,geom="errorbar",width=.2,color="black",position=position_dodge(0.2))+
  stat_summary(fun.y=mean,geom="line",position=position_dodge(0.2))

但是,当我尝试按年份对数据进行分析时(如下所示),我无法获得stat_summary来生成错误栏并获取下面的错误消息

ggplot(wickhami_sum, aes(x=week, y=wickhami,linetype=imidacloprid,group=imidacloprid))+
  stat_summary(fun.y=mean,geom="line",position=position_dodge(0.2))+facet_grid(year~.)+
  stat_summary(fun.data=mean_se,geom="errorbar",width=.2,color="black",position=position_dodge(0.2))

Warning message:
Removed 72 rows containing missing values (geom_errorbar). 

我已经尝试扩展y轴的范围/限制以包括错误条但我仍然得到相同的警告消息并且没有错误条。 我希望使用stat_summary来生成分面图的误差条,而不必再次计算标准误差。任何帮助都理解为什么faceting不允许stat_summary正常运行,或者我正在做的不正确。

1 个答案:

答案 0 :(得分:0)

以下是我认为发生的事情:在无面图中每周有两行数据,但在每个面板中每周只有一行,导致标准误差计算返回{{ 1}}。 NA用于未经过编程的数据,并在内部进行数据汇总。将stat_summarybug_subset_final一起使用,或切换到stat_summary继续使用geom_errorbar。详情如下。

您已预先汇总了数据,但wickhami_sum旨在处理原始数据并在内部计算汇总值。在您传递给ggplot的摘要数据框stat_summary中,每周有两行,2015年每周一行,2016年每周一行。按周和年的所有数据都有通过摘要操作将每周和每年折叠为单行。

因此,在未考虑的情节中,wickhami_sum有两行数据可以在每周进行操作。但是在分面的情节中,它试图从单个观察中计算标准误差,这可能会返回stat_summary,因此没有任何东西被绘制出来。即使在未考虑的情节中,您的误差线也是根据每年的两个平均值来计算的,这也不是您想要的。

相反,要么继续使用NA,要么使用wickhami_sum而不是:

stat_summary

或者,使用geom_errorbar(aes(ymin = wickhami - se, ymax=wickhami + se)) 使用原始数据(看起来像bug_subset_final):

stat_summary