我是python的新手,我想使用pandas转换数据框。
原始数据框为:
A1,B1,C1,M
A1,B1,C1,HM
A2,B2,C2,M
A2,B2,C2,M
A3,B3,C3,
目标是:
A1,B1,C1,HM
A2,B2,C2,M
A3,B3,C3,
我将需要删除重复项并根据值A,B,C计算最后一个字段(HM / M)。我想知道如何实现这种穿透性。
答案 0 :(得分:1)
IIUC,您可以.closed
并只选择每个sort_values
的{{1}},因为M是在HM之后排序的
first()
group