我有一个数据框,在对其进行分组时,得到了以下结果集。
Name | Score | Salary A | SALARY B
ABC | 20 | 300 | 500
XYZ | 30 | 400 | 600
PQR | 40 | 300 | 500
TFW | 50 | 0 | 0
OIP | 60 | 0 | 0
QWE | 50 | None | None
UYT | 40 | None | None
我需要比较薪水A和薪水B的值(薪水A对薪水A和薪水B对薪水B)。如果Salary是相同的,那么我要对分数求和,否则我必须取MAX的分数。
预期输出
Name | Score
ABC, PQR | 60
XYZ | 30
TFW | 50
OIP | 60
QWE | 50
UYT | 40
答案 0 :(得分:1)
我是这样做的:
a = pd.read_csv('yourdata.dat',sep='|')
a['total'] = a.iloc[:,2] + a.iloc[:,3]
a.groupby('total').agg({'Name ':','.join,' Score ':'sum'}).reset_index()[['Name ',' Score ']]
Name Score
0 ABC ,PQR 60
1 XYZ 30