我已经在下面列出了原始数据框的快照,我正在尝试根据10分钟的时间间隔聚合这些登录计数,并且可视化并描述最能显示模式的用户登录计数的时间序列的结果。我不知道如何最好地做到这一点?谢谢!
print(head(logins.data.frame))
以下是原始数据框的快照
#DateTime
#1 2012-03-01T00:05:55+00:00
#2 2012-03-01T00:06:23+00:00
#3 2012-03-01T00:06:52+00:00
#4 2012-03-01T00:11:23+00:00
#5 2012-03-01T00:12:47+00:00
#6 2012-03-01T00:12:54+00:00
答案 0 :(得分:1)
假设您的数据如下所示:
dates = as.POSIXct(c("2012-03-01 00:05:55+00:00", "2012-03-01 00:06:23+00:00","2012-03-01 00:06:52+00:00", "2012-03-01 00:11:23+00:00", "2012-03-01 00:12:47+00:00", "2012-03-01 00:12:54+00:00"))
将时间转换为分钟(我假设所有数据都在同一天,但不一定要概括这个假设):
minutes = as.numeric(format(dates, "%M")) + 60 * as.numeric(format(dates, "%H"))
用通常的R方式打分钟。我就是这样做的:
minute.max = ceiling(max(minutes))
bins = cut(minutes, breaks = 10*0:minute.max, labels = as.character(10*0:(minute.max-1)))
把它们放在一起:
df = data.frame(dates = dates, minutes = minutes, bins = bins)