dplyr:`group_by`和`mutate_each`错误

时间:2015-12-05 17:28:15

标签: r dplyr

我无法弄清楚为什么我的dplyr group_by / mutate_each功能正在被轰炸。当我使用默认的n = 2运行mutate_each时,它可以工作。它们都不适用于n = 1或n = 3。

library(dplyr)

## moving average function
get.mavg <- function(mycol, n=2) {
  require(zoo)
  mycol <- na.locf(mycol, na.rm=FALSE)
  if(length(mycol) < n) 
    return(mycol)
  c(mycol[1:(n-1)], rollapply(mycol, width=n, mean, align="right"))
}

dummy <- data_frame(Name1=c("A","A","A","A","B","B","B"),
                    Name2=c("B","B","C","C","C","C","C"),
                    stat = c(0,5,5,10, 10,5,5),
                    day = c(1:4, 1:3) )
dummy %>%
  group_by(Name2) %>%
  mutate_each(funs(get.mavg(.,3)), stat:day)
  

错误:不兼容的类型,期望整数向量

如果我尝试将列单独传递给我的移动平均功能,它就可以了!

get.mavg(dummy[dummy$Name2=="B",]$stat, 3)
# [1] 0 5
get.mavg(dummy[dummy$Name2=="C",]$stat, 3)
# [1] 5.000000 10.000000  8.333333  8.333333  6.666667

发生了什么事?

1 个答案:

答案 0 :(得分:3)

a bug如果您混合使用double和numeric,则会出现错误。我认为这是你的问题。

如果你改变了你的功能,确保你总是返回一个双重身份:

get.mavg <- function(mycol, n=2) {
  require(zoo)
  mycol <- na.locf(mycol, na.rm=FALSE)
  if(length(mycol) < n) 
    return(as.double(mycol))
  c(mycol[1:(n-1)], rollapply(mycol, width=n, mean, align="right"))
}

它适用于我:

dummy %>%
  group_by(Name2) %>%
  mutate_each(funs(get.mavg(.,3)), stat:day)
Source: local data frame [7 x 4]
Groups: Name2 [2]

  Name1 Name2      stat      day
  (chr) (chr)     (dbl)    (dbl)
1     A     B  0.000000 1.000000
2     A     B  5.000000 2.000000
3     A     C  5.000000 3.000000
4     A     C 10.000000 4.000000
5     B     C  8.333333 2.666667
6     B     C  8.333333 2.333333
7     B     C  6.666667 2.000000