我有两个数据框
数据框1
数据框2
ID列在两个表中不是唯一的。我想比较两个表中除ID之外的所有列,并打印唯一的行
预期产量
我尝试了'isin'函数,但是没有用。每个数据框的大小为150000,我删除了两个表中的重复项。请告知该怎么做?
答案 0 :(得分:0)
您可以使用df.append合并数据帧,然后使用df.duplicated来标记重复项。
df3 = df1.append(df, ignore_index=True)
df4 = df3.duplicated(subset=['Team', 'name', 'Country', 'Token'], keep=False)