R:在某些年份中每5分钟数据点->一天中的时间汇总

时间:2019-04-05 22:03:57

标签: r dataframe statistics

我在R中有data.frames,其中包含以5分钟为间隔测量的值。它的数据量很大(〜2mio)。

 date                    close     day
73 2015-01-02 00:05:00 0.00861385   0
74 2015-01-02 00:10:00 0.00861385   0
75 2015-01-02 00:15:00 0.00861385   0

我想按白天对数据进行分组。例如,将2015-01-02 00:05:00的值“ close”添加到2015-02-02 00:05:00的“ close”值,依此类推...

我很确定它易于管理,但是我不知道我要用Google搜索哪些搜索字词。任何面包屑都会受到高度赞赏。

PS:如果有任何避免循环的解决方案,那会很酷,因为它们的R速度非常慢

1 个答案:

答案 0 :(得分:0)

您可以使用library(data.table)执行此操作。

您的数据集为df

library(data.table)
setDT(df)                             # set your data.frame to data.table
df[, mins := .GRP, minute(date)]      # group by minutes of your 'date' field
df[, .(sums = sum(close)), by=mins]   # sum by group