我有在jupyter中读取的excel文件。
它具有三列: 1)网络研讨会ID :( 66个唯一值) 2)电子邮件:参与者的电子邮件ID(可以退出会话并再次加入,因此对于同一网络研讨会ID,重复的电子邮件ID) 3)会话时间(分钟):参与者在会话中,因为他可能会注销并再次登录,所以有多个条目。
使用的代码: data_group = data.groupby(['Webinar ID','Email'])
data_group ['会话时间(分钟)']。sum()
我想在excel中创建新列,并存储会话时间总和(分钟)信息-网络研讨会ID和电子邮件
谢谢!
答案 0 :(得分:0)
IIUC,您希望创建一个新列,其中包含每个网络研讨会组和电子邮件的时间总和。
让groupby
与transform
一起使用:
data['Sum Session Minutes'] = (data.groupby(['Webinar ID','Email'])['Time in Session (minutes)']
.transform('sum'))