更新了示例: 我的功能如下:
myfun <- function(DT, var){
for(i in 1:length(var)){
s = substitute(!(is.na(x) | is.nan(x)), list(x=as.symbol(eval(var[i]))))
DT = DT[eval(s)]
}
return(DT)
}
输入:
> dt = data.table(id=c(1,2,3,4,5), x=c(1,2,NA,4,5), y=c(1,NA,3,4,NA))
> dt
id x y
1: 1 1 1
2: 2 2 NA
3: 3 NA 3
4: 4 4 4
5: 5 5 NA
运行:
> myfun(dt, var=c("x", "y"))
id x y
1: 1 1 1
2: 4 4 4
> myfun(dt, var=c("x"))
id x y
1: 1 1 1
2: 2 2 NA
3: 4 4 4
4: 5 5 NA
var
是DT中某些变量的字符数组。目标是只获取DT中的行,NA
中的任何变量都没有NaN
或var
wrt。
我不想要for循环。我想构建一个包含所有条件的查询s
,然后评估DT
的查询。对于我想要的第一个案例:
s = !(is.na(x) | is.nan(x) | is.na(y) | is.nan(y))
对于我想要的第二种情况:
s = !(is.na(x) | is.nan(x))
如何构建动态查询s
,并在数据表中将其作为i/where
查询运行一次。
更一般地说,如何根据输入创建动态expression
。使用expression(paste())
对我没有帮助。然后我可以使用substitute
。
答案 0 :(得分:2)
和
var = c("x","y")
str=paste0("is.na(",var,") |", " is.nan(",var,")", collapse="|")
s = parse(text=paste("!(",str,")"))
DT[eval(s)]
源: How to use an unknown number of key columns in a data.table