data.table聚合到列表列

时间:2014-04-25 08:54:42

标签: r data.table

我正在尝试聚合data.table中的数据以创建一个新列,该列是以前的行列表。通过示例更容易看到:

dt <- data.table(id = c(1,1,1,1,2,2,3,3,3), letter = c('a','a','b','c','a','c','b','b','a'))

我想以这样的方式聚合它,结果应该是

   id  letter
1:  1 a,a,b,c
2:  2     a,c
3:  3   b,b,a  

直觉我试过

dt[,j = list(list(letter)), by = id]

但这不起作用。奇怪的是,当我逐个案例时,例如:

> dt[id == 1,j = list(list(letter)), by = id]

   id      V1
1:  1 a,a,b,c

结果很好......我觉得我错过了.SD某个地方或类似的东西......

有人能指出我正确的方向吗?

谢谢!

2 个答案:

答案 0 :(得分:5)

更新:行为DT[, list(list(.)), by=.]有时会导致R版本&gt; = 3.1.0的错误结果。现在,commit #1280 v1.9.3的当前开发版本中的data.table已修复此问题。来自NEWS

  
      
  • DT[, list(list(.)), by=.]也会在R&gt; = 3.1.0中返回正确的结果。该错误是由于最近(欢迎)R v3.1.0中的更改导致list(.)不会导致副本。关闭#481
  •   

通过此次更新,I()不再需要了。您可以像以前一样:DT[, list(list(.)), by=.]


这似乎与已知的bug #5585类似。在你的情况下,我认为你可以使用

dt[, paste(letter, collapse=","), by = id] 

解决您的问题。

正如@ilir指出的那样,如果确实需要获取列表(而不是显示的字符),您可以使用错误报告中建议的解决方法:

dt[, list(list(I(letter))), by = id]

答案 1 :(得分:1)

以下语法适用于我:

dt[, list(lst=list(letter)), by=id]

我正在使用R版本3.0.3,data.table_1.9.2。