根据组的第一行变换组中的每一行

时间:2017-06-27 07:58:41

标签: r dplyr

例如,我有一个数据框:

df <- data.frame(grp = c(1,1,1,1,1,2,2,2,2,2),
                 idx = c(1,2,3,4,5,1,2,3,4,5),
                 val = c(4,6,1,7,2,8,5,3,9,1))

我想将每行的val除以每组中第一行的val。我发现的唯一方法是引入一个新列:

 df %>% group_by(grp) %>%
        arrange(idx) %>%
        mutate(t = ifelse(row_number(idx) == 1, val, 0)) %>%
        mutate(val = val / sum(t))

有没有简单的方法可以做到这一点?

1 个答案:

答案 0 :(得分:5)

我们可以做到

 df %>%
  group_by(grp) %>%
  arrange(idx) %>%
  mutate(val = val/sum((row_number() == 1)*val))
# A tibble: 10 x 3
# Groups:   grp [2]
#     grp   idx   val
#   <dbl> <dbl> <dbl>
# 1     1     1 1.000
# 2     2     1 1.000
# 3     1     2 1.500
# 4     2     2 0.625
# 5     1     3 0.250
# 6     2     3 0.375
# 7     1     4 1.750
# 8     2     4 1.125
# 9     1     5 0.500
#10     2     5 0.125

如果我们需要除以第一个“val”观察值,只需执行val[1L]

df %>%
   group_by(grp) %>%
   arrange(idx) %>%
   mtuate(val = val/val[1L])