Dplyr:将条件应用于分组依据

时间:2018-11-26 15:44:47

标签: r dplyr rstudio

我正在尝试计算每个id在一个时间范围(time_end和time_start)中完成的作业总数,以及在这个时间间隔内任何id完成的最大作业数。

time_start和time_end的每个会话都是唯一的(时间戳)。 例如id1有2个会话,而id2有3个会话:

id1 session 1:- 1am to 1:15 am - jobs done 100 

id1 session 2:- 1:18am to 1:30 am - jobs done 90

id2 session 3:- 1:02am to 1:14am - jobs done 110

id2 session 4:- 1:17am to 1:30am - jobs done 85

id2 session 5:- 1.31am to 1:40am - jobs done 75

然后我要为每个会话完成任务和最多完成任务:

session 1: jobs-100, max jobs-110

session 2: jobs-90, max jobs-90

session 3: 110, 110

session 4: 85, 90

session 5: 75,75


contri <- df1 %>% group_by (id, time_end , time_start) %>% summarise(jobs=n())

contri_max <- job_contribution %>% group_by(time_end , time_start) %>% summarise(jobs_max = max(jobs))

第一条语句工作正常,可以给我每个会话的工作,但我无法使第二条语句正常工作。

有人可以帮忙吗?

0 个答案:

没有答案