根据10分钟的时间间隔汇总这些用户登录计数

时间:2017-04-08 20:53:13

标签: r machine-learning statistics time-series forecasting

我已经在下面列出了原始数据框的快照,我正在尝试根据10分钟的时间间隔聚合这些登录计数,并且可视化并描述最能显示模式的用户登录计数的时间序列的结果。我不知道如何最好地做到这一点?谢谢!

print(head(logins.data.frame))  

以下是原始数据框的快照

#DateTime
#1 2012-03-01T00:05:55+00:00
#2 2012-03-01T00:06:23+00:00
#3 2012-03-01T00:06:52+00:00
#4 2012-03-01T00:11:23+00:00
#5 2012-03-01T00:12:47+00:00
#6 2012-03-01T00:12:54+00:00

1 个答案:

答案 0 :(得分:1)

假设您的数据如下所示:

dates = as.POSIXct(c("2012-03-01 00:05:55+00:00", "2012-03-01 00:06:23+00:00","2012-03-01 00:06:52+00:00", "2012-03-01 00:11:23+00:00", "2012-03-01 00:12:47+00:00", "2012-03-01 00:12:54+00:00"))

将时间转换为分钟(我假设所有数据都在同一天,但不一定要概括这个假设):

minutes = as.numeric(format(dates, "%M")) + 60 * as.numeric(format(dates, "%H"))

用通常的R方式打分钟。我就是这样做的:

minute.max = ceiling(max(minutes))
bins = cut(minutes, breaks = 10*0:minute.max, labels = as.character(10*0:(minute.max-1)))

把它们放在一起:

df = data.frame(dates = dates, minutes = minutes, bins = bins)