假设我有这个数据框
Date DayOfWeek Url Hits
09/01/2016 Thursday url1 3
09/01/2016 Thursday url2 5
09/01/2016 Thursday url3 4
09/02/2016 Friday url1 7
09/02/2016 Friday url3 6
09/03/2016 Saturday url2 9
09/03/2016 Saturday url1 5
09/04/2016 Sunday url2 6
09/07/2016 Wednesday url10 4
09/07/2016 Thursday url2 3
09/07/2016 Thursday url4 2
09/07/2016 Thursday url5 3
09/07/2016 Thursday url1 3
09/08/2016 Friday url1 3
09/08/2016 Friday url4 3
09/08/2016 Friday url5 2
09/08/2016 Friday url8 6
09/09/2016 Saturday url2 1
09/09/2016 Saturday url3 2
09/09/2016 Saturday url5 4
09/09/2016 Saturday url1 8
09/14/2016 Thursday url1 3
09/147/2016 Thursday url2 2
09/14/2016 Thursday url3 3
我希望在访问过的唯一网址数量方面获得本周最忙碌的一天。例如,在数据框中有3个星期四,第一个星期四有3个唯一的网址访问,第二个星期四有4个,最后一个星期四有3个...我打算做的是,总和网址= 3 + 4 + 3 /(周四的数量= 3)=今天唯一的网址数量....
对于星期五,第一个将是2个网址,然后是第二个,有4个,计算将是2 + 4 /数据集中的星期五数量= 2
我正试图通过dplyr来解决这个问题。我正在尝试使用group_by,但我似乎无法确定正确的功能组合以达到我需要的效果。
答案 0 :(得分:6)
我们为每个'日期'和'DayOfWeek'(n_distinct
)获取不同的'Url'('N')的数量,并为每个'DayofWeek'获得'{1}}的'N'
mean