我有两个数据帧,我们称之为A和B.它们具有完全相同的7列(让他们称之为col1,col2,col3,col4,col5,col6和col7)。其中一些列包括client_id,client_first_name,client_last_name,电话号码等。(出于保密目的,我无法透露具体名称)。
DataFrame A比DataFrame B大得多,DataFrame B中的一些条目包含在DataFrame A中(即DataFrame B是DataFrame A的子集)。
问题是,我想确保DataFrame A中的记录不在DataFrame B中,即'减去'来自DataFrame A的DataFrame B.我该怎么做?
到目前为止,我已经添加了一个名为' group'对于这两个数据框架,使用pd.merge(A, B, how='left', on='col)
合并它们,然后拉出最后用'group_x'
和'group_y'
两个不同值的合并框(合并创建了这两个组。
有更简单的方法吗?我尝试了很多东西,但没有一个能奏效。
答案 0 :(得分:0)
是的,您的方式没问题,如果您不需要合并的数据框,也可以执行dfA.ix[!dfA.col.isin(dbB.col)]
之类的操作。