计算两个数据帧之间的Pandas差异

时间:2017-02-23 20:27:38

标签: python pandas

想知道如何使用两个不同的数据帧计算Python的Pandas中的集合差异。

一个数据帧(df1)的格式为:

State  City          Population
NY     Albany        856654
WV     Wheeling      23434
SC     Charleston    35323
OH     Columbus      343534
WV     Charleston    34523

第二个数据框(df2)是

State  City
WV     Wheeling
OH     Columns

我需要一个返回以下数据框的操作

State   City        Population
NY      Albany      856654
SC      Charleston  35323
WV      Charleston  34523

基本上,我无法弄清楚如何减去"来自df1的df2基于2列(需要两者,因为我将在不同的状态下重复使用城市名称)。

1 个答案:

答案 0 :(得分:1)

过滤器怎么样?

df1[~((df1.City.isin(df2.City)) & (df1.State.isin(df2.State)))]