如何在data.table中对符合某些最低标准的行进行子集化?

时间:2013-08-01 16:50:08

标签: r data.table

我是R中data.table的菜鸟,我想在这个例子中跳过z = 3的最后一个值:

> DT = data.table(y=c(1,1,2,2,2,3,3,3,4,4),x=1:10,z=c(1,1,1,1,2,2,2,2,3,3))
> DT[,list(list(predict(smooth.spline(x,y),c(4,5,6))$y)),by=z]

Error in smooth.spline(x, y) : need at least four unique 'x' values

如果我只是删除z = 3,我会得到我想要的答案:

> DT = data.table(y=c(1,1,2,2,2,3,3,3),x=1:8,z=c(1,1,1,1,2,2,2,2))
> DT[,list(list(predict(smooth.spline(x,y),c(4,5,6))$y)),by=z]

   z                                                  V1
1: 1  2.09999998977689,2.49999997903384,2.89999996829078
2: 2 0.999895853971133,2.04533519691888,2.90932467439562

多么棒的套餐!

2 个答案:

答案 0 :(得分:3)

省略行z是3就像

一样简单
DT[z!=3,  <whatever expression you'd like>]

如果您的data.table由z键入,那么您可以使用

DT[!.(3), .....]

答案 1 :(得分:1)

如果您只想在.N <4时省略结果,则可以使用if(不是ifelse)。如果.N <4,则不返回任何内容

DT[,if(.N>=4){ list(list(predict(smooth.spline(x,y),c(4,5,6))$y))},by=z]
#    z                                                  V1
# 1: 1   2.1000000266026,2.50000003412706,2.90000004165153
# 2: 2 0.999895884129996,2.04533520266699,2.90932466433092