数据表按周和userid聚合

时间:2016-10-24 15:26:29

标签: r data.table

我正在使用R并拥有一个包含3000万行的数据表DT

userid,     date, measurement
   101, 1/1/2011,          13
   101, 2/1/2011,          42
   ...
   333, 1/1/2011,          67
   ...

我正在考虑通过userid和 汇总观察结果。

我目前的想法是将日期转换为整数,然后除以7并使用floor函数,创建一个新的变量周。最后,我可以使用

DT[,.(measurement.Sum = sum(measurement)),by=.(userid,week)] 

这是最快的做事方式吗? (我读到了动物园图书馆,但在data.table和动物园图书馆之间切换似乎很麻烦)

1 个答案:

答案 0 :(得分:0)

data.table有一个week函数:

例如,请参阅How to get week numbers from dates?