我正在分析有关2016年大选的数据集。它们是美国县的人口统计数据和投票结果。我想将县范围缩小到大力支持特朗普的县。因此,我使用按县选举结果数据集创建了一个新的DataFrame,该数据集仅包含前往特朗普的县超过75%的县。我这样做是这样的:
strong_Trump = election_data2[election_data2['per_gop'] > 0.75]
strong_Trump.set_index('County')
现在我有了另一个完全不同的数据集,该数据集提供了按县分类的人口统计信息,但没有有关选举的信息。我如何将这两个数据集合并到一个DataFrame中,以便仅包含特朗普以75%的得票率赢得县的选举和人口统计信息?
答案 0 :(得分:1)
使用pandas.DataFrame.merge来连接两个数据框。 如果另一个DataFrame称为 demographic_df ,并且假设它也具有一列 Country ,则可以使用内部联接:
election_and_demographic_df = strong_Trump.merge(right=demographic_df, how='inner', left_on='Country', right_on='Country')
如果两个国家/地区的索引均已设置为国家/地区,则可以使用left_index=True
和right_index=True
代替left_on
和right_on
。