在data.table中从`j`中访问`by`变量

时间:2014-02-12 16:04:16

标签: r data.table

如果我有一个data.table并且我正在j进行一些函数调用,我是否可以访问by变量的当前值?

library(data.table)
d <- data.table(x=1:10, y=c('a', 'b'))

myfun <- function(DT) {
  print (DT$y)
}


d[, myfun(.SD), by=y]

对于更多上下文,我将第二个参数(另一个data.table)传递给myfun,并希望根据y的当前值对其进行子集化。它可以用虚拟变量完成,但这看起来很令人讨厌......

1 个答案:

答案 0 :(得分:11)

使用.BY - 这是by变量的列表:

d <- data.table(x=1:10, y=c('a', 'b'))
d[, .BY[[1]], by = y]  # [[1]] to access the first by variable, which is y
                       # if you had by = list(x, y) you'd do .BY[[2]] to access y
#   y V1
#1: a  a
#2: b  b

此外,列表已命名,因此您也可以按名称访问它:

d[, .BY$y, by = y]