Question

我有一个要剪切的数据框，并将每个子集保留为新列表的元素。切割是根据单元格的值给出的。例如，如果我有：

> df

     X1   X2
1     red  1
2    blue  3
3   green  2
4  pierre 10
5    pink  4
6    blue  3
7   green  2
8    eric 25
9  purple  8
10    red  1
11   anna 30
12   blue  3
13  green  2
14  black  5
15 yellow  6
16  marie 40
17 violet  7 

> df2

      X1    X2  X3
1 pierre  eric  77
2   anna marie 100

我想将df切成一些子集，这些子集的极限是那些行，其中X1的值等于df2中X1（对于上限）和X2（对于下限）给出的值。为了更清楚一点，我希望我的列表看起来像这样：

> list
[[1]] 
     X1   X2    
4  pierre 10
5    pink  4
6    blue  3
7   green  2
8    eric 25
[[2]]
     X1   X2
11   anna 30
12   blue  3
13  green  2
14  black  5
15 yellow  6
16  marie 40

我尝试使用for循环来做到这一点：

> for (i in 1:nrow(df2)){
   list[i]<-list(df[which(df[,"X1"]==df2[i,"X1"]):which(df[,"X1"]==df2[i,"X2"]),])
  }

但是我收到以下错误消息：

Error in list[i] <- list(df[which(df[, "X1"] == df2[i, "X1"]):which(df[,  : 
  object of type 'builtin' is not subsettable

您知道什么地方出了问题和/或以不同的方式获得预期结果吗？

Answer 1

使用 mapply ：

mapply(function(x, y){
  df[ which(df$X1 == x):which(df$X1 == y), ]
  }, x = df2$X1, y = df2$X2, SIMPLIFY = FALSE)
# $pierre
# X1 X2
# 4 pierre 10
# 5   pink  4
# 6   blue  3
# 7  green  2
# 8   eric 25
# 
# $anna
# X1 X2
# 11   anna 30
# 12   blue  3
# 13  green  2
# 14  black  5
# 15 yellow  6
# 16  marie 40

Answer 2

使用for循环是可行的，尽管@ zx8754的mapply()方法应该更有效。

test <- vector("list", nrow(df2))
for(i in 1:nrow(df2)){
  x <- which(df[, "X1"] == df2[i, "X1"])
  y <- which(df[, "X1"] == df2[i, "X2"])
  test[[i]] <- df[x:y,]
}

> test
[[1]]
      X1 X2
4 pierre 10
5   pink  4
6   blue  3
7  green  2
8   eric 25

[[2]]
       X1 X2
11   anna 30
12   blue  3
13  green  2
14  black  5
15 yellow  6
16  marie 40

根据R中的像元值构建数据帧子集的列表

2 个答案: