R:通过ddply

时间:2017-06-06 16:24:29

标签: r plyr lapply

我试图通过分组变量在一些数据上运行一系列不同的过滤器。例如,此代码用于在分组变量(齿轮)上生成一个过滤器(0.1)。

library(plyr)
library(BBmisc)
mtcars <- mtcars[order(mtcars$gear),]
mtcars2 <- ddply(mtcars,.(gear),transform,mpgfilter = as.numeric(stats::filter(mpg, filter=0.1, method="recursive")))

但我想要一种方法,所以我可以提供多个过滤器。我在考虑将代码嵌套在lapply函数中。例如,以下是变化的过滤器(作为列表):

newdata <- as.data.frame(seq(from = 0.1, to = 0.9, by = 0.1))
newdata <- as.data.frame(t(newdata))
colnames(newdata) = newdata[1, ]
colnames(newdata) <- paste("V", colnames(newdata), sep = "_")
newlist <- convertColsToList(newdata)

以下是我正在考虑的解决方案(不工作):

newlist3 <- lapply(newlist, function(y){
  mtcars2 <- ddply(mtcars,.(gear), transform, mpgfilter = as.numeric(stats::filter(mpg, filter=y, method="recursive")))
})

有什么建议吗?我的最终输出是一个数据帧,每列显示不同过滤器的输出。如果有更好的方法,答案不必使用lapply / ddply。

感谢。

1 个答案:

答案 0 :(得分:1)

我想我已经以迂回的方式回答了我自己的问题,使用'by'函数而不是ddply:

new <- lapply(newlist, function(y){
by(mtcars, mtcars$gear, function(x) mpgfilter = as.numeric(stats::filter(x$mpg, filter=y, method="recursive")))})

new2 <- lapply(new, function(y){
  resultsdf <- as.data.frame(t(do.call(rbind,y)))})
df <- as.data.frame(ldply(new2, data.frame))
df2 <- melt(df)
df2 <- ddply(df2,".id",transform,ID=1:length(.id))
finaldata <- dcast(df2, ID + variable ~ .id, value.var = "value")

将其恢复到可行的数据框所需的额外工作有点麻烦,但这样做。