熊猫对两列进行分组,并根据结果在Excel中创建新列

时间:2020-05-18 14:43:32

标签: python pandas numpy

我有在jupyter中读取的excel文件。

它具有三列: 1)网络研讨会ID :( 66个唯一值) 2)电子邮件:参与者的电子邮件ID(可以退出会话并再次加入,因此对于同一网络研讨会ID,重复的电子邮件ID) 3)会话时间(分钟):参与者在会话中,因为他可能会注销并再次登录,所以有多个条目。

使用的代码: data_group = data.groupby(['Webinar ID','Email'])

data_group ['会话时间(分钟)']。sum()

我想在excel中创建新列,并存储会话时间总和(分钟)信息-网络研讨会ID和电子邮件

谢谢!

1 个答案:

答案 0 :(得分:0)

IIUC,您希望创建一个新列,其中包含每个网络研讨会组和电子邮件的时间总和。

groupbytransform一起使用:

data['Sum Session Minutes'] = (data.groupby(['Webinar ID','Email'])['Time in Session (minutes)']
                                   .transform('sum'))