我有以下数据框:
x_1 x_2 x_3 x_4 x_5 ID cost
0 159 xyz 883nne2 28h93 lightz 10 2
1 159 xyz 883nne2 28h93 lightz 10 5
2 354 abc 94mmm4k heavy 15 2
3 354 abc 94mmm4k heavy 15 1
4 354 abc 94mmm4k 455h 15 7
5 354 abc 94mmm4k super 3 2
6 354 abc 94mmm4k 53g 10 4
7 354 abc 94mmm4k 53g 10 4
我想找到x_1,x_2,x_3,x_4,x_5,ID列的每个唯一组合的计数,并获取这些计数的总和,并应用在cost列中找到的值以得出每个唯一组合的总和找到。
希望最终结果将如下所示:
x_1 x_2 x_3 x_4 x_5 ID count sum
0 159 xyz 883nne2 28h93 lightz 10 2 7
1 354 abc 94mmm4k heavy 15 2 3
2 354 abc 94mmm4k 455h 15 1 7
3 354 abc 94mmm4k super 3 1 2
4 354 abc 94mmm4k 53g 10 2 8
答案 0 :(得分:1)
让我们对groupby
做agg
s=df.groupby(['x_1','x_2','x_3','x_4','x_5','ID'],as_index=False)['cost'].agg(['count','sum'])