计算和绘制时间间隔均值

时间:2017-02-18 14:34:22

标签: r ggplot2 dplyr timeserieschart group-summaries

我想使用dplyr和ggplot2计算和绘制不同颜色的动物的数量随时间变化。

我在随机日期观察了不同的动物,因此我首先想将这些观察结果分组为4天括号,然后计算每个4天括号的平均颜色。我创建了专栏Bracket.mean,前几个用于表示我的想法。我想在相同的数据框中添加这些方法(而不是创建新的data.frame或向量),以便以后进行分析和绘图,如果可能的话。

对于情节,我希望显示括号意味着它周围的一些方差(SD或箱图)以及每日观察(可能是背景中观察的褪色叠加)随着时间的推移。

下面是我正在使用的数据集的一部分(我希望编写一个'Bracket.mean'列。) “计数”是指特定“颜色”的给定“日期”上的动物数量。

    Date    Julian  Count   Color   Bracket.color
4/19/16 110 1   50  mean of 4/19-4/22
4/19/16 110 1   50  mean of 4/19-4/22
4/19/16 110 1   100 mean of 4/19-4/22
4/20/16 111 4   50  mean of 4/19-4/22
4/20/16 111 1   0   mean of 4/19-4/22
4/20/16 111 2   100 mean of 4/19-4/22
4/20/16 111 1   50  mean of 4/19-4/22
4/20/16 111 2   100 mean of 4/19-4/22
4/21/16 112 1   100 mean of 4/19-4/22
4/21/16 112 2   50  mean of 4/19-4/22
4/21/16 112 4   50  mean of 4/19-4/22
4/21/16 112 1   100 mean of 4/19-4/22
4/21/16 112 2   50  mean of 4/19-4/22
4/21/16 112 1   0   mean of 4/19-4/22
4/22/16 113 2   0   mean of 4/19-4/22
4/22/16 113 4   50  mean of 4/23-4/26
4/23/16 114 6   0   mean of 4/23-4/26
4/23/16 114 1   50  mean of 4/23-4/26
4/24/16 115 2   0   mean of 4/23-4/26
4/26/16 117 5   0   mean of 4/23-4/26
4/30/16 121 1   50  
5/2/16  123 1   NA  
5/2/16  123 1   50  
5/7/16  128 2   0   
5/7/16  128 3   0   
5/7/16  128 3   0   
5/8/16  129 4   0   
5/8/16  129 1   0   
5/10/16 131 1   50  
5/10/16 131 4   50  
5/12/16 133 1   0   
5/13/16 134 1   50  
5/14/16 135 1   0   
5/14/16 135 2   50  
5/14/16 135 2   0   
5/14/16 135 1   0   
5/17/16 138 1   0   
5/17/16 138 2   0   
5/23/16 144 1   0   
5/24/16 145 4   0   
5/24/16 145 1   0   
5/24/16 145 1   0   
5/27/16 148 3   NA  
5/27/16 148 1   0   
5/27/16 148 1   50  

非常感谢任何帮助。非常感谢提前!

1 个答案:

答案 0 :(得分:0)

这样的事情应该让你开始。

library(dplyr)
df <- df %>% mutate(Date = as.Date(Date, format='%m/%d/%y'),
                    Start = as.Date(cut(Date, breaks= seq(min(Date), max(Date)+4, by = 4)))) %>%
    mutate(End = Start+3) %>%
    group_by(Start,End) %>%
    summarise(meanColor = mean(Color, na.rm=T),
              sdColor = sd(Color, na.rm=T))
df
#Source: local data frame [10 x 4]
#Groups: Start [?]
#        Start        End meanColor  sdColor
#        <date>     <date>     <dbl>    <dbl>
#1  2016-04-19 2016-04-22  56.25000 35.93976
#2  2016-04-23 2016-04-26  12.50000 25.00000
#3  2016-04-27 2016-04-30  50.00000       NA
#4  2016-05-01 2016-05-04  50.00000       NA
#5  2016-05-05 2016-05-08   0.00000  0.00000
#6  2016-05-09 2016-05-12  33.33333 28.86751
#7  2016-05-13 2016-05-16  20.00000 27.38613
#8  2016-05-17 2016-05-20   0.00000  0.00000
#9  2016-05-21 2016-05-24   0.00000  0.00000
#10 2016-05-25 2016-05-28  25.00000 35.35534

然后使用,

绘图
library(ggplot)
ggplot(df) + geom_line(aes(Start,meanColor))