使用pandas

时间:2016-10-24 10:32:47

标签: python pandas

我有一个具有重复列名的数据框。我想将所有相同的条目合并为一个条目。

数据的csv数据是,

id,col1,col2,col1,col2
'a',1,0,1,0
'b',0,1,1,0
'c',1,0,0,0

我要找的结果是,

id,col1,col2
'a',2,0
'b',1,1
'c',1,0

我想总结各栏。

我是pandas的新手,似乎无法找到如何正确聚合值。请注意,我有大约> 4000列。

1 个答案:

答案 0 :(得分:5)

您可以按列名使用groupby并汇总sum

print (df.groupby(level= 0, axis=1).sum())
   col1  col2   id
0     2     0  'a'
1     1     1  'b'
2     1     0  'c'