条件增量式

时间:2018-06-27 11:09:24

标签: r dplyr

我一直在搜索tidyverse中如何有条件地递增,但未成功。我想做的是检查列中的值是否大于某个x,如果是,则将整数增加1。每个观察都从1开始。

示例代码:

id = c(1, 1, 1, 2, 3, 3, 3, 3, 4)
time = c(20, 30, 101, 33, 50, 101, 30, 110, 30)

df_x = data.frame(id = id, time = time)

输出:

  id time
1  1   20
2  1   30
3  1  101
4  2   33
5  3   50
6  3  101
7  3   30
8  3  110
9  4   30

所需的输出:

increment = c(1, 1, 2, 1, 1, 2, 2, 3, 1)

df_x$increment = increment

   id time increment
1  1   20         1
2  1   30         1
3  1  101         2
4  2   33         1
5  3   50         1
6  3  101         2 
7  3   30         2
8  3  110         3
9  4   30         1

它的代码如下:

df_x %>%
  group_by(id) %>%
  mutate(ifelse(time <= 100, ?, ?))

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:3)

这可以使用累积总和来完成,例如,每次值大于100时,累积总和就会递增。

df_x %>% 
  group_by(id) %>% 
  mutate(increment = 1 + cumsum(time > 100))

# A tibble: 9 x 3
# Groups:   id [4]
     id  time increment
  <dbl> <dbl>     <dbl>
1    1.   20.        1.
2    1.   30.        1.
3    1.  101.        2.
4    2.   33.        1.
5    3.   50.        1.
6    3.  101.        2.
7    3.   30.        2.
8    3.  110.        3.
9    4.   30.        1.

我使用1 + cumsum(...)来从1 instad的0开始第一个组。并不是说如果给定id组中的第一个值> 100,则该组可能以2开始。