我有2个数据帧
df1
a b c
1 2 3
2 4 5
3 6 7
和
df2
a b c
1 3 4
3 1 8
我希望输出
df3
a b c
1 5 7
2 4 5
3 7 15
我尝试了df1.add(df2,axis='c')
但未获得准确的输出。
引用此链接http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.add.html
答案 0 :(得分:3)
a
set_index
和参数df
,fill_value=0
列需要add
。
如有必要,请将值转换为int
和reset_index
:
df = df1.set_index('a').add(df2.set_index('a'),fill_value=0).astype(int).reset_index()
print (df)
a b c
0 1 5 7
1 2 4 5
2 3 7 15
如果fill_value
NaN
,则删除不常见的行会忽略DataFrames
并添加dropna
df = df1.set_index('a').add(df2.set_index('a')).dropna().astype(int).reset_index()
print (df)
a b c
0 1 5 7
1 3 7 15
答案 1 :(得分:1)
也许你可以试试这个:
>>> import pandas as pd
>>>
>>> df1 = pd.DataFrame([(1, 2, 3), (2, 4, 5), (3, 6, 7)], columns=['a', 'b', 'c'])
>>>
>>> df2 = pd.DataFrame([(1, 3, 4), (3, 1, 8)], columns=['a', 'b', 'c'])
>>>
>>> df1.index = df1['a']
>>> del df1['a']
>>>
>>> df2.index = df2['a']
>>> del df2['a']
>>>
>>> df1.add(df2, fill_value=0)
b c
a
1 5.0 7.0
2 4.0 5.0
3 7.0 15.0
或使用set_index()
方法:
>>> df1.set_index('a').add(df2.set_index('a'), fill_value=0)
b c
a
1 5.0 7.0
2 4.0 5.0
3 7.0 15.0