`dcast`与空RHS

时间:2015-05-18 23:26:46

标签: r data.table

有没有办法在没有先指定要翻转的变量的情况下翻转我的数据?在我看来,逻辑默认是组内索引。

例如,

DT <- data.table(id = rep(6:10, each = 3), var = rnorm(15))
DT
#     id         var
#  1:  6  1.58293930
#  2:  6  0.44234019
#  3:  6 -0.06576521
#  4:  7 -0.65124980
#  5:  7  0.88371933
#  6:  7 -1.94998135
#  7:  8 -1.95746466
#  8:  8 -0.50978195
#  9:  8 -0.40450447
# 10:  9 -0.61097399
# 11:  9 -0.92335213
# 12:  9 -0.19881983
# 13: 10  0.13022635
# 14: 10 -0.30141200
# 15: 10  0.78355188

对于每个id,我想要的基本上是var在不同列中的每个值(NA s,如果有id var DT[ , I := 1:.N, by = id] dcast(DT, id ~ I, value.var = "var") # id 1 2 3 # 1: 6 1.5829393 0.4423402 -0.06576521 # 2: 7 -0.6512498 0.8837193 -1.94998135 # 3: 8 -1.9574647 -0.5097820 -0.40450447 # 4: 9 -0.6109740 -0.9233521 -0.19881983 # 5: 10 0.1302263 -0.3014120 0.78355188 I相关的值),可以这样做:

dcast(DT, id~ ., value.var = "var")

但是,如果我不必首先定义# id . # 1: 6 3 # 2: 7 3 # 3: 8 3 # 4: 9 3 # 5: 10 3 ,那将会更方便:

Start()

但这不起作用:

  

缺少聚合函数,默认为'length'

Process

是否可能有一个聚合函数可以传递以获得所需的效果?

2 个答案:

答案 0 :(得分:3)

现在可以使用rowid功能:

dcast(DT, id ~ rowid(id), value.var = "var")
#    id          1          2          3
# 1:  6  1.1050942  0.1271620  1.3051373
# 2:  7 -0.5441056 -0.6866828 -0.8083762
# 3:  8 -0.6812820 -1.1934716 -1.3913903
# 4:  9 -0.3462497 -0.8229276 -1.0884394
# 5: 10 -0.4600681  0.6173795 -1.0125658

有关更多选项,示例和说明,请参阅?rowid

答案 1 :(得分:2)

如果您的桌子已满,您可以使用以下技术:

dt<-data.table(id=rep(6:10,each=3), var=rnorm(15))
dt[, as.list(setNames(var, 1:length(var))), id]
#    id       1       2        3
# 1:  6 -1.6187  0.9227 -0.12284
# 2:  7  0.9898  0.3489  1.21193
# 3:  8 -1.5968  1.3802  0.09284
# 4:  9 -1.9527 -0.6347  1.11014
# 5: 10  0.6093 -1.0609 -0.66372

这个技巧在data.table问题上使用了几天。如果有人关注该帖并且可以回忆该帖子,请随时编辑。