例如,我有以下两个数据集:
df1 =
df2 =
这里df2的值已经在df1中(行1、4和5)。 现在,我必须制作另一个数据集df3,其中仅存在第2行和第3行。
df3 =
我研究了很多有关拆分数据集的内容,但是作为一个新的学习者,我找不到确切的解决方案。 如果我说错了,请随时纠正我。如果有人可以在这个问题上帮助我,我将感到非常高兴。谢谢。
答案 0 :(得分:2)
要获取DF的差异,请使用以下drop_duplicate方法
pd.concat([df1,df2]).drop_duplicates(keep=False)