我有一个非常大的数据集,显示网站的登录信息。我正在尝试按用户名计算登录频率。
我希望获得的是一个如下表格,其中句点列为列标题,频率是行名称,数据是在给定日期登录的用户数量标题行,即
[weekday] [Mon][tue][etc]
[logins ]
[ 1][123][456][789]
[ 2][987][654][321]
[ etc][123][456][789]
源数据只是登录ID,日期/时间登录。我已经能够根据登录日期添加附加月份,日期名称和日期编号的列。
理想情况下,我希望能够为每个类别(月,日,日名称)获得与上述相同的摘要。
library(lubridate )
library(dplyr)
library(rpivotTable)
df = data.frame(datasource)
df$MonthNumber <- month(df$Date)
df$DayNumber <- wday(df$Date, FALSE, FALSE)
df$DayName <- wday(df$Date, TRUE, FALSE)
#problem is here, i dont know how to get the count of user logins per day
Results <- xtabs(~ DayCount + c(DayName,USERID), df)
write.csv(Results, file="weekdata.csv")
Results