想知道如何使用两个不同的数据帧计算Python的Pandas中的集合差异。
一个数据帧(df1)的格式为:
State City Population
NY Albany 856654
WV Wheeling 23434
SC Charleston 35323
OH Columbus 343534
WV Charleston 34523
第二个数据框(df2)是
State City
WV Wheeling
OH Columns
我需要一个返回以下数据框的操作
State City Population
NY Albany 856654
SC Charleston 35323
WV Charleston 34523
基本上,我无法弄清楚如何减去"来自df1的df2基于2列(需要两者,因为我将在不同的状态下重复使用城市名称)。
答案 0 :(得分:1)
过滤器怎么样?
df1[~((df1.City.isin(df2.City)) & (df1.State.isin(df2.State)))]