如何比较两个表中的多列并找出重复项?

时间:2020-11-03 04:08:12

标签: python-3.x pandas dataframe

我有两个数据框

数据框1

Name

数据框2

enter image description here

ID列在两个表中不是唯一的。我想比较两个表中除ID之外的所有列,并打印唯一的行

预期产量

enter image description here

我尝试了'isin'函数,但是没有用。每个数据框的大小为150000,我删除了两个表中的重复项。请告知该怎么做?

1 个答案:

答案 0 :(得分:0)

您可以使用df.append合并数据帧,然后使用df.duplicated来标记重复项。

df3 = df1.append(df, ignore_index=True)
df4 = df3.duplicated(subset=['Team', 'name', 'Country', 'Token'], keep=False)