Question

我已尝试过所有内容，但无法找到适用于我的数据的任何内容。

我有80,000行数据，我想写一些代码，每5行平均一次，显然反过来的代码行数减少了5倍。

                timestamp curr_proc_units entitled_cycles capped_cycles
1481000580 2016-12-05 23:03:00               1       512269820      17400328
1481000640 2016-12-05 23:04:00               1       511754172      15196426
1481000700 2016-12-05 23:05:00               1       512715413      17452370
1481000760 2016-12-05 23:06:00               1       512334707     124006106
1481000820 2016-12-05 23:07:00               1       510737517      34001018
1481000880 2016-12-05 23:08:00               1       512152279      15343897
       uncapped_cycles
1481000580       47532.200
1481000640        9154.117
1481000700       45975.650
1481000760     4018213.067
1481000820      145820.350
1481000880       41980.917

Answer 1

使用dplyr：

library(dplyr)
group_by(df, group = cut(timestamp, breaks = "5 min")) %>% 
  summarize_all(funs(mean(.)))

Answer 2

我们可以使用data.table

library(data.table)
setDT(df1)[, lapply(.SD, mean), .(grp = cut(timestamp, breaks = "5 min"))]

R中我的数据的5分钟间隔

2 个答案: