根据R中的日期时间范围计算重复项

时间:2015-09-18 14:50:52

标签: r datetime duplicates

通过统计7天内有记录的用户实例,我需要帮助进行总结。事件不必是第一次出现,而是7天内发生的任何实例。

User     Datetime
User1    3/4/2015 12:14
User1    3/24/2015 15:25
User2    4/15/2015 11:08
User2    4/17/2015 5:06
User2    4/20/2015 6:17
User2    4/28/2015 12:15
User3    5/12/2015 9:48
User3    5/18/2015 11:54
User3    5/18/2015 11:59

我尝试使用aggregatemelt,但如果我仅按日期将日期时间视为因素,那么这只会给我计算。

因此,在上面的示例数据中,User2的计数为2,User3的计数为2.

1 个答案:

答案 0 :(得分:0)

关于将Datetime视为因素的评论,我不太清楚。下面的代码假设Datetime是数据框中的一个字符串,我将其称为df.它将df$Datetime转换为Date对象,然后在每个7天的间隔内对记录进行计数其他。

df$Datetime <- as.Date(df$Datetime, format="%m/%d/%Y" )
record_count <- aggregate(df$Datetime, by = list(df$User), function(x) sum(diff(x)<7))