Question

我正在分析有关2016年大选的数据集。它们是美国县的人口统计数据和投票结果。我想将县范围缩小到大力支持特朗普的县。因此，我使用按县选举结果数据集创建了一个新的DataFrame，该数据集仅包含前往特朗普的县超过75％的县。我这样做是这样的：

strong_Trump = election_data2[election_data2['per_gop'] > 0.75]
strong_Trump.set_index('County')

现在我有了另一个完全不同的数据集，该数据集提供了按县分类的人口统计信息，但没有有关选举的信息。我如何将这两个数据集合并到一个DataFrame中，以便仅包含特朗普以75％的得票率赢得县的选举和人口统计信息？

Answer 1

使用pandas.DataFrame.merge来连接两个数据框。如果另一个DataFrame称为 demographic_df ，并且假设它也具有一列 Country ，则可以使用内部联接：

election_and_demographic_df = strong_Trump.merge(right=demographic_df, how='inner', left_on='Country', right_on='Country')

如果两个国家/地区的索引均已设置为国家/地区，则可以使用left_index=True和right_index=True代替left_on和right_on。