在R(dplyr包)中使用weighted_mean和summarise_at时出错

时间:2018-02-20 16:01:19

标签: r dplyr

尝试在{(weighted_mean包)中使用summarise_at作为dplyr的聚合函数时,收到以下错误消息:

  

summarise_impl(.data,dots)中的错误:         评估错误:' x'和' w'必须有相同的长度。

这是我的代码:

a = data.frame(snapshot_date = c("1-Jan-2016", "1-Jan-2016", "1-Feb-2016", "1-Feb-2016"),
           rate = c(0.75, 0.2, 0.5, 0.1),
           newrate = c(0.9, 0.4, 0.6, 0.3),
           balance = c(1000,2000,3000,4000))
b = a %>%
  group_by(snapshot_date)

summarise_at(.tbl = b,
            .vars = c("rate", "newrate"),
           .funs = weighted.mean, 
           w = b$balance, na.rm = FALSE)

当我删除权重参数时,我不再收到错误消息,并且得到正确(未加权)的结果,如下所示:

summarise_at(.tbl = b,
         .vars = c("rate", "newrate"),
         .funs = weighted.mean, 
         na.rm = FALSE)

的产率:

# A tibble: 2 x 3
  snapshot_date  rate newrate
  <fct>         <dbl>   <dbl> 
1 1-Feb-2016    0.300   0.450
2 1-Jan-2016    0.475   0.650
> 

尝试使用砝码时我做错了什么?

1 个答案:

答案 0 :(得分:2)

不确定不确定它在哪里出错,但这种方式可行

b = a %>%
  group_by(snapshot_date) %>%
  summarise_at(vars(rate, newrate), funs(weighted.mean(., balance)))

# A tibble: 2 x 3
  snapshot_date  rate newrate
  <fct>         <dbl>   <dbl>
1 1-Feb-2016    0.271   0.429
2 1-Jan-2016    0.383   0.567