为重复记录创建新的平均分数[userid,itemid]

时间:2016-11-26 23:07:05

标签: python pandas dataframe duplicates

我有一个如下所示的数据框:

userid  itemid   score
1       5        4
2       3        10
1       5        20
2       3        30

我想将此数据框转换为:

userid  itemid   score
1       5        22
2       3        20

我计划使用2 for循环执行此操作。但是,我想知道是否有任何推荐的方法来完成这项任务? groupby似乎无效,因为它没有average功能。有什么帮助吗?

1 个答案:

答案 0 :(得分:1)

尝试使用groupbysum

df.groupby(['userid', 'itemid']).mean()

enter image description here