标签: python pandas
我有一个具有重复列名的数据框。我想将所有相同的条目合并为一个条目。
数据的csv数据是,
id,col1,col2,col1,col2 'a',1,0,1,0 'b',0,1,1,0 'c',1,0,0,0
我要找的结果是,
id,col1,col2 'a',2,0 'b',1,1 'c',1,0
我想总结各栏。
我是pandas的新手,似乎无法找到如何正确聚合值。请注意,我有大约> 4000列。
答案 0 :(得分:5)
您可以按列名使用groupby并汇总sum:
groupby
sum
print (df.groupby(level= 0, axis=1).sum()) col1 col2 id 0 2 0 'a' 1 1 1 'b' 2 1 0 'c'