根据R中的像元值构建数据帧子集的列表

时间:2019-02-07 10:27:58

标签: r list dataframe for-loop subset

我有一个要剪切的数据框,并将每个子集保留为新列表的元素。切割是根据单元格的值给出的。例如,如果我有:

> df

     X1   X2
1     red  1
2    blue  3
3   green  2
4  pierre 10
5    pink  4
6    blue  3
7   green  2
8    eric 25
9  purple  8
10    red  1
11   anna 30
12   blue  3
13  green  2
14  black  5
15 yellow  6
16  marie 40
17 violet  7 

> df2

      X1    X2  X3
1 pierre  eric  77
2   anna marie 100

我想将df切成一些子集,这些子集的极限是那些行,其中X1的值等于df2中X1(对于上限)和X2(对于下限)给出的值。 为了更清楚一点,我希望我的列表看起来像这样:

> list
[[1]] 
     X1   X2    
4  pierre 10
5    pink  4
6    blue  3
7   green  2
8    eric 25
[[2]]
     X1   X2
11   anna 30
12   blue  3
13  green  2
14  black  5
15 yellow  6
16  marie 40

我尝试使用for循环来做到这一点:

> for (i in 1:nrow(df2)){
   list[i]<-list(df[which(df[,"X1"]==df2[i,"X1"]):which(df[,"X1"]==df2[i,"X2"]),])
  }     

但是我收到以下错误消息:

Error in list[i] <- list(df[which(df[, "X1"] == df2[i, "X1"]):which(df[,  : 
  object of type 'builtin' is not subsettable

您知道什么地方出了问题和/或以不同的方式获得预期结果吗?

2 个答案:

答案 0 :(得分:1)

使用 mapply

mapply(function(x, y){
  df[ which(df$X1 == x):which(df$X1 == y), ]
  }, x = df2$X1, y = df2$X2, SIMPLIFY = FALSE)
# $pierre
# X1 X2
# 4 pierre 10
# 5   pink  4
# 6   blue  3
# 7  green  2
# 8   eric 25
# 
# $anna
# X1 X2
# 11   anna 30
# 12   blue  3
# 13  green  2
# 14  black  5
# 15 yellow  6
# 16  marie 40

答案 1 :(得分:1)

使用for循环是可行的,尽管@ zx8754的mapply()方法应该更有效。

test <- vector("list", nrow(df2))
for(i in 1:nrow(df2)){
  x <- which(df[, "X1"] == df2[i, "X1"])
  y <- which(df[, "X1"] == df2[i, "X2"])
  test[[i]] <- df[x:y,]
}

> test
[[1]]
      X1 X2
4 pierre 10
5   pink  4
6   blue  3
7  green  2
8   eric 25

[[2]]
       X1 X2
11   anna 30
12   blue  3
13  green  2
14  black  5
15 yellow  6
16  marie 40