我正在使用R并拥有一个包含3000万行的数据表DT
:
userid, date, measurement
101, 1/1/2011, 13
101, 2/1/2011, 42
...
333, 1/1/2011, 67
...
我正在考虑通过userid和 周 汇总观察结果。
我目前的想法是将日期转换为整数,然后除以7并使用floor函数,创建一个新的变量周。最后,我可以使用
DT[,.(measurement.Sum = sum(measurement)),by=.(userid,week)]
这是最快的做事方式吗? (我读到了动物园图书馆,但在data.table和动物园图书馆之间切换似乎很麻烦)