如何在一列上覆盖具有覆盖的熊猫数据框?

时间:2019-03-01 15:44:20

标签: python pandas join override concat

考虑以下数据帧:

import pandas as pd

data1={'column_a' : ['a','a','b','c','d','e'],
      'column_b' : [1,2,3,4,5,6],
      'column_c' : [9,8,6,4,5,4]}

data2={'column_a' : ['f','f','g','a','a','a'],
      'column_b' : [7,8,9,7,5,6],
      'column_c' : [6,8,7,6,5,4]}

df_1 = pd.DataFrame(data1)
df_2 = pd.DataFrame(data2)

如何连接两个数据帧,以便将df_2附加到df_1,但在df_1上覆盖column_a? 我正在寻找以下结果

column_a    column_b    column_c
b   3   6
c   4   4
d   5   5
e   6   4
f   7   6
f   8   8
g   9   7
a   7   6
a   5   5
a   6   4

请注意,{{1}中最上面带有'a'的2行不再可用,因为它们被df_1中的3个a覆盖了。

1 个答案:

答案 0 :(得分:3)

只需在appendconcat之前做一个过滤器

pd.concat([df_1.loc[~df_1.column_a.isin(df_2.column_a)],df_2])
Out[29]: 
  column_a  column_b  column_c
2        b         3         6
3        c         4         4
4        d         5         5
5        e         6         4
0        f         7         6
1        f         8         8
2        g         9         7
3        a         7         6
4        a         5         5
5        a         6         4