R:如何删除data.frame中的某些行

时间:2015-07-08 22:10:28

标签: r subset

> data = data.frame(a = c(100, -99, 322, 155, 256), b = c(23, 11, 25, 25, -999))
> data
    a    b
1 100   23
2 -99   11
3 322   25
4 155   25
5 256 -999

对于这样的data.frame,我想删除包含-99或-999的任何行。所以我生成的data.frame应该只包含第1,3和4行。

我正在考虑为此编写循环,但我希望这是一种更简单的方法。 (如果我的data.frame要有a-z列,那么循环方法会非常笨重)。我的循环可能看起来像这样

i = 1
for(i in 1:nrow(data)){
  if(data$a[i] < 0){
    data = data[-i,]
  }else if(data$b[i] < 0){
    data = data[-i,]
  }else data = data
}

3 个答案:

答案 0 :(得分:6)

 data [ rowSums(data == -99 | data==-999) == 0 , ]
    a  b
1 100 23
3 322 25
4 155 25

&#34; ==&#34;和&#34; |&#34; (OR)运算符作为矩阵作用于数据帧,返回相同维度的逻辑对象,以便rowSums成功。

答案 1 :(得分:4)

也许这个:

ind <- Reduce(`|`,lapply(data,function(x) x %in% c(-99,-999)))
> data[!ind,]
    a  b
1 100 23
3 322 25
4 155 25

答案 2 :(得分:1)

@ rawr的评论可能在导入过程中最有意义。不过,如果您已有数据,则可以执行类似操作:

na.omit(replace(data, sapply(data,`%in%`,c(-99,-999)), NA))
#    a  b
#1 100 23
#3 322 25
#4 155 25