Question

假设我有这个数据框

Date           DayOfWeek    Url    Hits
09/01/2016     Thursday     url1   3
09/01/2016     Thursday     url2   5
09/01/2016     Thursday     url3   4
09/02/2016     Friday       url1   7
09/02/2016     Friday       url3   6
09/03/2016     Saturday     url2   9
09/03/2016     Saturday     url1   5
09/04/2016     Sunday       url2   6
09/07/2016     Wednesday    url10  4
09/07/2016     Thursday     url2   3
09/07/2016     Thursday     url4   2
09/07/2016     Thursday     url5   3
09/07/2016     Thursday     url1   3
09/08/2016     Friday     url1   3
09/08/2016     Friday     url4   3
09/08/2016     Friday     url5   2
09/08/2016     Friday     url8   6
09/09/2016     Saturday     url2   1
09/09/2016     Saturday     url3   2
09/09/2016     Saturday     url5   4
09/09/2016     Saturday     url1   8
09/14/2016     Thursday     url1   3
09/147/2016     Thursday     url2   2
09/14/2016     Thursday     url3   3

我希望在访问过的唯一网址数量方面获得本周最忙碌的一天。例如，在数据框中有3个星期四，第一个星期四有3个唯一的网址访问，第二个星期四有4个，最后一个星期四有3个...我打算做的是，总和网址= 3 + 4 + 3 /（周四的数量= 3）=今天唯一的网址数量....

对于星期五，第一个将是2个网址，然后是第二个，有4个，计算将是2 + 4 /数据集中的星期五数量= 2

我正试图通过dplyr来解决这个问题。我正在尝试使用group_by，但我似乎无法确定正确的功能组合以达到我需要的效果。

Answer 1

我们为每个'日期'和'DayOfWeek'（n_distinct）获取不同的'Url'（'N'）的数量，并为每个'DayofWeek'获得'{1}}的'N'

mean

在R中获得一定天数的平均值/平均值

1 个答案: