赋予数据框df_1
Code | Jan | Feb | Mar
a | 1 | 2 | 1
b | 3 | 4 | 3
和df_2
Code | Jan | Feb | Mar
a | 1 | 1 | 2
c | 7 | 0 | 0
我想将这些汇总到基于行和列的表中。因此,我的结果数据帧应如下所示:
Code | Jan | Feb | Mar
a | 2 | 3 | 3
b | 3 | 4 | 3
c | 7 | 0 | 0
有没有简单的方法可以做到这一点?我可以使用很多for循环和if语句来做到这一点,但这对于大型数据集来说非常慢。
答案 0 :(得分:3)
使用concat
并汇总sum
:
df = pd.concat([df_1, df_2]).groupby('Code', as_index=False).sum()
print (df)
Code Jan Feb Mar
0 a 2 3 3
1 b 3 4 3
2 c 7 0 0