我已尝试过所有内容,但无法找到适用于我的数据的任何内容。
我有80,000行数据,我想写一些代码,每5行平均一次,显然反过来的代码行数减少了5倍。
timestamp curr_proc_units entitled_cycles capped_cycles
1481000580 2016-12-05 23:03:00 1 512269820 17400328
1481000640 2016-12-05 23:04:00 1 511754172 15196426
1481000700 2016-12-05 23:05:00 1 512715413 17452370
1481000760 2016-12-05 23:06:00 1 512334707 124006106
1481000820 2016-12-05 23:07:00 1 510737517 34001018
1481000880 2016-12-05 23:08:00 1 512152279 15343897
uncapped_cycles
1481000580 47532.200
1481000640 9154.117
1481000700 45975.650
1481000760 4018213.067
1481000820 145820.350
1481000880 41980.917
答案 0 :(得分:2)
使用dplyr:
library(dplyr)
group_by(df, group = cut(timestamp, breaks = "5 min")) %>%
summarize_all(funs(mean(.)))
答案 1 :(得分:1)
我们可以使用data.table
library(data.table)
setDT(df1)[, lapply(.SD, mean), .(grp = cut(timestamp, breaks = "5 min"))]