在pandas数据帧中进行行排序并删除重复项

时间:2016-11-18 07:06:00

标签: python python-2.7 python-3.x pandas

我在pandas dataframe df中有一个表

col1    col2     count
12       15        3
13       17        5
1        36        4
15       12        7
36       1         4

等...... 我想要的是考虑像'12和15'以及'15和12'这样的卡片是相同的,并且还要计算它们的数量 并创建一个新的数据帧df2 没有重复的条目和他们的计数被添加。 例如。

col1    col2     count
12       15        10     #3+7
13       17        5
1        36        8       #4+4 

等等。 我应该使用哪种方法来获得它? 提前致谢

1 个答案:

答案 0 :(得分:3)

对行进行排序,然后分组和求和:

df[['a', 'b']] = df[['a', 'b']].apply(sorted, axis=1)
df.groupby(['a', 'b'], as_index=False)['c'].sum()