协助比较2个不同数据框中的多列

时间:2019-07-14 23:30:37

标签: python pandas

我有2个数据框:

df1根据日期有100-300行
df2包含10,000-40,000,具体取决于一天

列如下:

df1:

ID      STATE     STATUS
1         NY      ACCEPTED
1         PA      ACCEPTED
1         CA      ACCEPTED
2         NY      ACCEPTED
3         NY      ACCEPTED

df2:

ID       COUNTRY    STATUS
1          US       ACCEPTED
2          US       
3          US       ACCEPTED
4          US       
5          US       ACCEPTED

我需要能够从df1中获取每个条目,并确定df1中的哪些条目在df2中具有可接受的状态。 df1中的所有条目均已被接受,因此我唯一需要检查的是df2中是否也接受了它们。

我不确定的是:

如何找到相同的ID,然后检查该行的状态并为每个返回true或false?

好处是,在那之后,我仍然需要从df2中提取所有未被接受的ID,以便我可以使用它们,所以我不能销毁df2。

1 个答案:

答案 0 :(得分:0)

您可以合并两个数据框并使用pd.merge检查状态:

pd.merge(left=df_a, right=df_b, on='id',suffixes=('_df_a','_df_b'))

enter image description here