子集data.frames列表并返回data.frames列表

时间:2013-07-30 11:44:03

标签: r dataframe subset

我意识到这个问题与this one(以及其他人)非常相似,但我似乎无法修改解决方案以适应我的问题。如果需要,请标记为重复或链接到现有答案。以下是从上述问题略微修改的一些示例数据:

a=c(1,2,3,4,5,6)
b=c(4,5,6,5,5,5)
c=c(3,4,5,6,7,8)
A=data.frame(a=a,b=b,c=c)
B=data.frame(a=c,b=b,c=a)
C=data.frame(a=b,b=c,c=a)
l <- list(A, B, C)

我想生成一个数据帧列表,它是与条件匹配的原始数据帧(在l中)的子集。例如,我可能希望返回大于或等于4的所有值,其中较低的值替换为NA,以便我的新列表subsetl如下所示。 (我不关心将NA保持在数据框中的正确位置。)

> subsetl
[[1]]
a b  c
1 NA 4 NA
2 NA 5  4
3 NA 6  5
4  4 5  6
5  5 5  7
6  6 5  8

[[2]]
a b  c
1 NA 4 NA
2  4 5 NA
3  5 6 NA
4  6 5  4
5  7 5  5
6  8 5  6

[[3]]
a  b  c
1 4 NA NA
2 5  4 NA
6  5 NA
4 5  6  4
5 5  7  5
6 5  8  6

我希望我的例子清楚明白,但如果没有,请告诉我。毫无疑问,使用lapplysapply之类的内容很简单,但是在使用列表时我无法正确使用语法,特别是当数据帧列表是理想的结果时。

1 个答案:

答案 0 :(得分:4)

这应该适合你:

subsetl <- lapply(l,function(x) {
    x[x<4] <- NA
    return(x)
})

结果:

>subsetl
[[1]]
   a b  c
1 NA 4 NA
2 NA 5  4
3 NA 6  5
4  4 5  6
5  5 5  7
6  6 5  8

[[2]]
   a b  c
1 NA 4 NA
2  4 5 NA
3  5 6 NA
4  6 5  4
5  7 5  5
6  8 5  6

[[3]]
  a  b  c
1 4 NA NA
2 5  4 NA
3 6  5 NA
4 5  6  4
5 5  7  5
6 5  8  6