我在R中有data.frames,其中包含以5分钟为间隔测量的值。它的数据量很大(〜2mio)。
date close day
73 2015-01-02 00:05:00 0.00861385 0
74 2015-01-02 00:10:00 0.00861385 0
75 2015-01-02 00:15:00 0.00861385 0
我想按白天对数据进行分组。例如,将2015-01-02 00:05:00的值“ close”添加到2015-02-02 00:05:00的“ close”值,依此类推...
我很确定它易于管理,但是我不知道我要用Google搜索哪些搜索字词。任何面包屑都会受到高度赞赏。
PS:如果有任何避免循环的解决方案,那会很酷,因为它们的R速度非常慢
答案 0 :(得分:0)
您可以使用library(data.table)执行此操作。
您的数据集为df
:
library(data.table)
setDT(df) # set your data.frame to data.table
df[, mins := .GRP, minute(date)] # group by minutes of your 'date' field
df[, .(sums = sum(close)), by=mins] # sum by group