我的目标是分析城市环境中私立学校与农村私立学校的学费变化。
我有一个数据框,其中包括美国所有私立学校的学费(tuit_cost
)。数据框tuit_cost
包含历史学费的列以及标题为['State','City/Town Name']
的两列。
我还有一个单独的私立学校数据框,被归类为“城市”杂志。区域(urban_schools
)。此数据框只有两列 - ['State','City/Town Name']
。
我合并了数据框,以便只与城市学校一起创建一个数据框。历史学费数据。
urban_school_tuit = pd.merge(urban_schools, tuit_cost, how='left', left_on= ['State','City/Town Name'], right_on=['State','City/Town Name']).dropna()
现在我想创建一个只有农村学校的数据框。通过从urban_school_tuit
中删除tuit_cost
中的所有行来保存历史学费数据。
最有效的方法是什么?
谢谢!
答案 0 :(得分:2)
能够一起修补这个以创建所需的数据帧(在Python 3中)......
rural_schools = tuit_cost.drop(list(zip(urban_schools['State'],urban_schools['City/Town Name'])))
对任何进一步的指导或建议持开放态度。