Question

我的目标是分析城市环境中私立学校与农村私立学校的学费变化。

我有一个数据框，其中包括美国所有私立学校的学费（tuit_cost）。数据框tuit_cost包含历史学费的列以及标题为['State','City/Town Name']的两列。

我还有一个单独的私立学校数据框，被归类为“城市”杂志。区域（urban_schools）。此数据框只有两列 - ['State','City/Town Name']。

我合并了数据框，以便只与城市学校一起创建一个数据框。历史学费数据。

urban_school_tuit = pd.merge(urban_schools, tuit_cost, how='left', left_on= ['State','City/Town Name'], right_on=['State','City/Town Name']).dropna()

现在我想创建一个只有农村学校的数据框。通过从urban_school_tuit中删除tuit_cost中的所有行来保存历史学费数据。

最有效的方法是什么？

谢谢！

Answer 1

能够一起修补这个以创建所需的数据帧（在Python 3中）......

rural_schools = tuit_cost.drop(list(zip(urban_schools['State'],urban_schools['City/Town Name'])))

对任何进一步的指导或建议持开放态度。