我有一个要剪切的数据框,并将每个子集保留为新列表的元素。切割是根据单元格的值给出的。例如,如果我有:
> df
X1 X2
1 red 1
2 blue 3
3 green 2
4 pierre 10
5 pink 4
6 blue 3
7 green 2
8 eric 25
9 purple 8
10 red 1
11 anna 30
12 blue 3
13 green 2
14 black 5
15 yellow 6
16 marie 40
17 violet 7
> df2
X1 X2 X3
1 pierre eric 77
2 anna marie 100
我想将df切成一些子集,这些子集的极限是那些行,其中X1的值等于df2中X1(对于上限)和X2(对于下限)给出的值。 为了更清楚一点,我希望我的列表看起来像这样:
> list
[[1]]
X1 X2
4 pierre 10
5 pink 4
6 blue 3
7 green 2
8 eric 25
[[2]]
X1 X2
11 anna 30
12 blue 3
13 green 2
14 black 5
15 yellow 6
16 marie 40
我尝试使用for循环来做到这一点:
> for (i in 1:nrow(df2)){
list[i]<-list(df[which(df[,"X1"]==df2[i,"X1"]):which(df[,"X1"]==df2[i,"X2"]),])
}
但是我收到以下错误消息:
Error in list[i] <- list(df[which(df[, "X1"] == df2[i, "X1"]):which(df[, :
object of type 'builtin' is not subsettable
您知道什么地方出了问题和/或以不同的方式获得预期结果吗?
答案 0 :(得分:1)
使用 mapply :
mapply(function(x, y){
df[ which(df$X1 == x):which(df$X1 == y), ]
}, x = df2$X1, y = df2$X2, SIMPLIFY = FALSE)
# $pierre
# X1 X2
# 4 pierre 10
# 5 pink 4
# 6 blue 3
# 7 green 2
# 8 eric 25
#
# $anna
# X1 X2
# 11 anna 30
# 12 blue 3
# 13 green 2
# 14 black 5
# 15 yellow 6
# 16 marie 40
答案 1 :(得分:1)
使用for
循环是可行的,尽管@ zx8754的mapply()
方法应该更有效。
test <- vector("list", nrow(df2))
for(i in 1:nrow(df2)){
x <- which(df[, "X1"] == df2[i, "X1"])
y <- which(df[, "X1"] == df2[i, "X2"])
test[[i]] <- df[x:y,]
}
> test
[[1]]
X1 X2
4 pierre 10
5 pink 4
6 blue 3
7 green 2
8 eric 25
[[2]]
X1 X2
11 anna 30
12 blue 3
13 green 2
14 black 5
15 yellow 6
16 marie 40