我在数据框上使用填充(来自padr
包)来填补时间间隔。现在,为了填充指定的一组列的间隙值,我使用的是fill_by_function
。通常,fill_by_function
将未加引号的列名称作为参数。但是,就我而言,我已经获得了一个列名列表。
我的问题是,如何在fill_by_function
函数中传递列列表。请注意,列的列表未预先定义,因此我无法对fill_by_function
内的列名进行硬编码。
以下是我尝试的示例,但出现了错误。
x <- seq(as.Date('2016-01-01'), by = 'day', length.out = 366)
x <- x[sample(1:366, 200)] %>% sort
x.df <- data.frame(x = x,
y1 = runif(200, 10, 20) %>% round,
y2 = runif(200, 1, 50) %>% round,
y3 = runif(200, 20, 40) %>% round)
c.list <- c("y1","y2")
x.df %>% pad %>% fill_by_function(as.name(c.list),fun=mean)
以下是我收到的错误消息
Error in inds[i] <- which(colnames_x == as.character(cols[[i]])) : replacement has length zero
我可以使用其他任何替代功能
答案 0 :(得分:0)
这对我有用:
x.df %>% pad %>% fill_by_function(.cols=c.list,fun=mean) %>% tail(.)
x y1 y2 y3
361 2016-12-26 14.725 24.31 30.09
362 2016-12-27 14.000 28.00 21.00
363 2016-12-28 14.725 24.31 30.09
364 2016-12-29 15.000 47.00 22.00
365 2016-12-30 14.000 43.00 34.00
366 2016-12-31 17.000 14.00 21.00
比较:
x.df %>% pad %>% fill_by_function(y1,fun=mean) %>% tail(.)
x y1 y2 y3
361 2016-12-26 14.725 NA NA
362 2016-12-27 14.000 28 21
363 2016-12-28 14.725 NA NA
364 2016-12-29 15.000 47 22
365 2016-12-30 14.000 43 34
366 2016-12-31 17.000 14 21
检查输出实际上是您想要的。