在pandas中按唯一列添加2个数据帧列

时间:2017-05-09 10:25:25

标签: python pandas

我有2个数据帧

df1

a b c 
1 2 3
2 4 5
3 6 7 

df2
a b c
1 3 4
3 1 8

我希望输出

df3 
a b c
1 5 7
2 4 5
3 7 15

我尝试了df1.add(df2,axis='c')但未获得准确的输出。

引用此链接http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.add.html

2 个答案:

答案 0 :(得分:3)

a set_index和参数dffill_value=0列需要add

如有必要,请将值转换为intreset_index

df = df1.set_index('a').add(df2.set_index('a'),fill_value=0).astype(int).reset_index()
print (df)
   a  b   c
0  1  5   7
1  2  4   5
2  3  7  15

如果fill_value

中没有NaN,则删除不常见的行会忽略DataFrames并添加dropna
df = df1.set_index('a').add(df2.set_index('a')).dropna().astype(int).reset_index()
print (df)
   a  b   c
0  1  5   7
1  3  7  15

答案 1 :(得分:1)

也许你可以试试这个:

>>> import pandas as pd
>>>
>>> df1 = pd.DataFrame([(1, 2, 3), (2, 4, 5), (3, 6, 7)], columns=['a', 'b', 'c'])
>>>
>>> df2 = pd.DataFrame([(1, 3, 4), (3, 1, 8)], columns=['a', 'b', 'c'])
>>>
>>> df1.index = df1['a']
>>> del df1['a']
>>>
>>> df2.index = df2['a']
>>> del df2['a']
>>>
>>> df1.add(df2, fill_value=0)
     b     c
a
1  5.0   7.0
2  4.0   5.0
3  7.0  15.0

或使用set_index()方法:

>>> df1.set_index('a').add(df2.set_index('a'), fill_value=0)
     b     c
a
1  5.0   7.0
2  4.0   5.0
3  7.0  15.0