Question

我试图通过分组变量在一些数据上运行一系列不同的过滤器。例如，此代码用于在分组变量（齿轮）上生成一个过滤器（0.1）。

library(plyr)
library(BBmisc)
mtcars <- mtcars[order(mtcars$gear),]
mtcars2 <- ddply(mtcars,.(gear),transform,mpgfilter = as.numeric(stats::filter(mpg, filter=0.1, method="recursive")))

但我想要一种方法，所以我可以提供多个过滤器。我在考虑将代码嵌套在lapply函数中。例如，以下是变化的过滤器（作为列表）：

newdata <- as.data.frame(seq(from = 0.1, to = 0.9, by = 0.1))
newdata <- as.data.frame(t(newdata))
colnames(newdata) = newdata[1, ]
colnames(newdata) <- paste("V", colnames(newdata), sep = "_")
newlist <- convertColsToList(newdata)

以下是我正在考虑的解决方案（不工作）：

newlist3 <- lapply(newlist, function(y){
  mtcars2 <- ddply(mtcars,.(gear), transform, mpgfilter = as.numeric(stats::filter(mpg, filter=y, method="recursive")))
})

有什么建议吗？我的最终输出是一个数据帧，每列显示不同过滤器的输出。如果有更好的方法，答案不必使用lapply / ddply。

感谢。

Answer 1

我想我已经以迂回的方式回答了我自己的问题，使用'by'函数而不是ddply：

new <- lapply(newlist, function(y){
by(mtcars, mtcars$gear, function(x) mpgfilter = as.numeric(stats::filter(x$mpg, filter=y, method="recursive")))})

new2 <- lapply(new, function(y){
  resultsdf <- as.data.frame(t(do.call(rbind,y)))})
df <- as.data.frame(ldply(new2, data.frame))
df2 <- melt(df)
df2 <- ddply(df2,".id",transform,ID=1:length(.id))
finaldata <- dcast(df2, ID + variable ~ .id, value.var = "value")

将其恢复到可行的数据框所需的额外工作有点麻烦，但这样做。

R：通过ddply

1 个答案: