R对连续重复的奇数行求和,并除去除第一个之外的所有

时间:2019-04-08 08:40:35

标签: r

我遇到了一个问题-如何对连续重复的奇数行求和并删除除第一行外的所有行。我已经知道如何对连续重复的行求和并删除除第一行以外的所有行(链接:https://stackoverflow.com/a/32588960/11323232)。但是对于这个项目,我想对连续重复的奇数行求和,但不是对所有连续重复的奇数行求和。

 ia<-c(1,1,2,NA,2,1,1,1,1,2,1,2)
 time<-c(4.5,2.4,3.6,1.5,1.2,4.9,6.4,4.4, 4.7, 7.3,2.3, 4.3)
 a<-as.data.frame(cbind(ia, time))

  a
   ia time
1   1  4.5
2   1  2.4
3   2  3.6
5   2  1.2
6   1  4.9
7   1  6.4
8   1  4.4
9   1  4.7
10  2  7.3
11  1  2.3
12  2  4.3

to 

 a
   ia time
1   1  6.9
3   2  3.6
5   2  1.2
6   1  20.4
10  2  7.3
11  1  2.3
12  2  4.3

如何针对我的目标编辑以下代码以求出连续重复的奇数行之和,并删除除第一行以外的所有行?

 result <- a %>%
 filter(na.locf(ia) == na.locf(ia, fromLast = TRUE)) %>%
 mutate(ia = na.locf(ia)) %>%
 mutate(change = ia != lag(ia, default = FALSE)) %>%
 group_by(group = cumsum(change), ia) %>%
 # this part
 summarise(time = sum(time))

2 个答案:

答案 0 :(得分:1)

一种dplyr可能是:

a %>%
 group_by(grp = with(rle(ia), rep(seq_along(lengths), lengths))) %>%
 mutate(grp2 = ia %/% 2 == 0,
        time = sum(time)) %>%
 filter(!grp2 | (grp2 & row_number() == 1)) %>%
 ungroup() %>%
 select(-grp, -grp2)

      ia  time
  <dbl> <dbl>
1     1   6.9
2     2   3.6
3     2   1.2
4     1  20.4
5     2   7.3
6     1   2.3
7     2   4.3

答案 1 :(得分:0)

您可以尝试使用data.table进行以下操作:

library(data.table)
ia <- c(1,1,2,NA,2,1,1,1,1,2,1,2)
time <- c(4.5,2.4,3.6,1.5,1.2,4.9,6.4,4.4, 4.7, 7.3,2.3, 4.3)
a <- data.table(ia, time)
a[, sum(time), by=.(ia, rleid(!ia %% 2 == 0))]

给予

##   ia rleid   V1
##1:  1     1  6.9
##2:  2     2  3.6
##3: NA     3  1.5
##4:  2     4  1.2
##5:  1     5 20.4
##6:  2     6  7.3
##7:  1     7  2.3
##8:  2     8  4.3