r mapply vs“bad lapply”

时间:2018-01-05 03:27:20

标签: r vectorization lapply mapply

我想我在这里错过了一些简单的事情: 我有一个data.frames列表,以及一个要选择的行号列表。 像这样:

a <- data.frame(q = c(1,0,0,0), 
                w = c(1,1,0,0),
                e = c(1,1,1,0),
                r = c(1,1,1,1))
b <- a + 1
c <- a + 2
d <- a + 3

data <- list(a = a, b = b, c = c, d = d)

ind_a <- c(1, 2) 
ind_b <- c(1, 3)
ind_c <- c(1, 4)
ind_d <- c(2, 4)

train <- list(ind_a, ind_b, ind_c, ind_d) 

现在,我想选择行,我认为正确的形式可能是

test1 <- mapply(function(x,y) x[y, ], data, train)

但是我能使它发挥作用的唯一方法是

test2 <- lapply(1:4, function(x) data[[x]][train[[x]], ])

这对我来说似乎是假的for循环......

我哪里错了???

1 个答案:

答案 0 :(得分:4)

使用mapply时,默认选项为SIMPLIFY = TRUE,当维度相同时,它会将其简化为数组。如果我们将其更改为FALSE,则输出将为list

mapply(function(x,y) x[y, ], data, train, SIMPLIFY = FALSE)

或使用Map包装

Map(function(x, y) x[y, ], data, train)