在Python中合并两个数据框

时间:2017-02-08 14:34:26

标签: python pandas dataframe

如何在python中叠加/合并两个数据帧,以便添加重叠的单元格(索引,列),并且不常见的单元格保留原始数据框中的值?

这可以在Excel中解释here

对于Eg: 我有两个数据框

df1 = df1 df2 = df2

我希望输出像

output_df = output_df

1 个答案:

答案 0 :(得分:1)

add需要fillna,但df1df2必须为NaN个值,因为fillna已将其删除:

print (df1.add(df2, fill_value=0).fillna(0).astype(int))
    a    b    c
a1  1    2    0
a2  3  514  123
a3  5  539  134

indexesunion reindex的另一个解决方案 - NaN中的DataFrames有效:

idx = df1.index.union(df2.index)

print (df1.reindex(idx, fill_value=0))
    a  b
a1  1  2
a2  3  4
a3  5  6

print (df2.reindex(idx, fill_value=0))
      b    c
a1    0    0
a2  510  123
a3  533  134

idx = df1.index.union(df2.index)
print (df1.reindex(idx, fill_value=0)
       .add(df2.reindex(idx, fill_value=0), fill_value=0)
       .astype(int))
    a    b    c
a1  1    2    0
a2  3  514  123
a3  5  539  134
df1 = pd.DataFrame({'a':[1,3,5],
                   'b':[2,4,6]}, index=['a1','a2','a3'])

print (df1)
    a  b
a1  1  2
a2  3  4
a3  5  6

df2 = pd.DataFrame({'b':[510,533],
                   'c':[123,np.nan]}, index=['a2','a3'])

print (df2)
      b      c
a2  510  123.0
a3  533    NaN

print (df1.reindex(idx, fill_value=0).add(df2.reindex(idx, fill_value=0), fill_value=0))
      a    b      c
a1  1.0    2    0.0
a2  3.0  514  123.0
a3  5.0  539    NaN
print (df1.add(df2, fill_value=0).fillna(0).astype(int))
    a    b    c
a1  1    2    0
a2  3  514  123
a3  5  539    0 <- replace NaN to 0