我想从另一个中删除一个Dataframe(第一个df是第二个的子集)

时间:2016-12-07 15:22:43

标签: python python-2.7 python-3.x pandas dataframe

我的目标是分析城市环境中私立学校与农村私立学校的学费变化。

我有一个数据框,其中包括美国所有私立学校的学费(tuit_cost)。数据框tuit_cost包含历史学费的列以及标题为['State','City/Town Name']的两列。

我还有一个单独的私立学校数据框,被归类为“城市”杂志。区域(urban_schools)。此数据框只有两列 - ['State','City/Town Name']

我合并了数据框,以便只与城市学校一起创建一个数据框。历史学费数据。

urban_school_tuit = pd.merge(urban_schools, tuit_cost, how='left', left_on= ['State','City/Town Name'], right_on=['State','City/Town Name']).dropna()

现在我想创建一个只有农村学校的数据框。通过从urban_school_tuit中删除tuit_cost中的所有行来保存历史学费数据。

最有效的方法是什么?

谢谢!

1 个答案:

答案 0 :(得分:2)

能够一起修补这个以创建所需的数据帧(在Python 3中)......

rural_schools = tuit_cost.drop(list(zip(urban_schools['State'],urban_schools['City/Town Name'])))

对任何进一步的指导或建议持开放态度。