r:如何使用lapply删除来自多个数据帧中单独列表的行号

时间:2014-09-17 14:48:45

标签: r list lapply

我在列表对象中组织了许多数据框。我有第二个向量列表,其中包含我想在数据框中删除的行号。要删除的行对于每个数据帧是不同的。因此,数据帧列表中的元素数量等于矢量列表中的元素数量。这是我尝试过的代码:

test_list<-vector(mode="list",5)
test_list<-lapply(test_list, function(x) data.frame(1,1:10,"c"))
vec_list<-vector(mode="list",5)
vec_list<-lapply(vec_list, function (x) x<-sample(seq(1,10),4))
clean_list<-lapply(test_list, function (x,y) clean_list<-x[-y,],vec_list)

2 个答案:

答案 0 :(得分:3)

当您有多个相应对象列表时,使用Mapmapply函数比使用lapply更自然。

Map(function(l, v) l[-v,], test_list, vec_list)

答案 1 :(得分:1)

如果您想使用lapply,一种方法是:

  lapply(seq_along(test_list), function(i) test_list[[i]][-vec_list[[i]],])

基准

在中等列表数据上,

 set.seed(45)
 test_list<-vector(mode="list",25e3)
 test_list<-lapply(test_list, function(x) data.frame(1,1:10,"c"))
 vec_list<-vector(mode="list",25e3)
 vec_list<-lapply(vec_list, function (x) x<-sample(seq(1,10),4))

 library(microbenchmark)
 f1 <- function() lapply(seq_along(test_list), function(i) test_list[[i]][-vec_list[[i]],])
 f2 <- function() Map(function(l, v) l[-v,], test_list, vec_list)

 microbenchmark(f1(), f2(), unit="relative", times=25L)
 #Unit: relative
 #expr       min        lq  median       uq       max neval
 #f1() 0.9874164 0.9977816 1.00573 1.000419 0.9837334    25
 #f2() 1.0000000 1.0000000 1.00000 1.000000 1.0000000    25