合并DataFrame并仅保留不匹配的条目

时间:2017-08-27 11:28:41

标签: python pandas dataframe

我有两个DataFrame:

dfA = pd.DataFrame([['A', 'B', 'C', 'D'], ['A1', 'B1', 'C1', 'D1'], ['A2', 'B2', 'C2', 'D2'], ['A', 'B3', 'C3', 'D3'], ['A', 'B', 'C4', 'D5']], columns = ['AA', 'BB', 'CC', 'DD'])

       AA  BB  CC  DD
    0   A   B   C   D
    1  A1  B1  C1  D1
    2  A2  B2  C2  D2
    3   A  B3  C3  D3
    4   A   B  C4  D5

dfB = pd.DataFrame([['A', 'B'], ['A', 'B3']], columns = ['AA', 'BB'])

  AA  BB
0  A   B
1  A  B3

我想在['AA', 'BB']列上合并它们,我希望只保留不匹配的条目:

result = pd.DataFrame([['A1', 'B1', 'C1', 'D1'], ['A2', 'B2', 'C2', 'D2']], columns = ['AA', 'BB', 'CC', 'DD'])

   AA  BB  CC  DD
0  A1  B1  C1  D1
1  A2  B2  C2  D2

感谢您的帮助。

1 个答案:

答案 0 :(得分:2)

我认为您正在寻找这个,合并和删除已合并索引的行。

dfA.drop(pd.merge(dfA,dfB,on=['AA','BB'],right_index=True).index)

输出:

   AA  BB  CC  DD
1  A1  B1  C1  D1
2  A2  B2  C2  D2