如何在R中的数据表中创建动态查询

时间:2013-09-04 12:53:28

标签: r data.table

更新了示例: 我的功能如下:

myfun <- function(DT, var){  
  for(i in 1:length(var)){
    s = substitute(!(is.na(x) | is.nan(x)), list(x=as.symbol(eval(var[i]))))
    DT = DT[eval(s)]
  }
  return(DT)
}

输入:

> dt = data.table(id=c(1,2,3,4,5), x=c(1,2,NA,4,5), y=c(1,NA,3,4,NA))
> dt
   id  x  y
1:  1  1  1
2:  2  2 NA
3:  3 NA  3
4:  4  4  4
5:  5  5 NA

运行:

> myfun(dt, var=c("x", "y"))
   id x y
1:  1 1 1
2:  4 4 4
> myfun(dt, var=c("x"))
   id x  y
1:  1 1  1
2:  2 2 NA
3:  4 4  4
4:  5 5 NA

var是DT中某些变量的字符数组。目标是只获取DT中的行,NA中的任何变量都没有NaNvar wrt。

我不想要for循环。我想构建一个包含所有条件的查询s,然后评估DT的查询。对于我想要的第一个案例:

s = !(is.na(x) | is.nan(x) | is.na(y) | is.nan(y))

对于我想要的第二种情况:

s = !(is.na(x) | is.nan(x))

如何构建动态查询s,并在数据表中将其作为i/where查询运行一次。

更一般地说,如何根据输入创建动态expression。使用expression(paste())对我没有帮助。然后我可以使用substitute

1 个答案:

答案 0 :(得分:2)

var = c("x","y")
str=paste0("is.na(",var,") |", " is.nan(",var,")", collapse="|")
s = parse(text=paste("!(",str,")"))
DT[eval(s)]

源: How to use an unknown number of key columns in a data.table