熊猫似乎两次合并相同的数据帧

时间:2021-03-26 17:44:40

标签: pandas join merge

我在pandas中有两个数据框,其中一个'datapanel'有多年的国家数据,另一个'data'只有一年的国家数据,但还包括一个“区域指标”列对于每个国家。我只想在数据面板框架中创建一个新列,为每个国家/地区提供“区域指标”。出于某种原因,数据帧的行在这次合并后几乎翻了一番,而它们应该保持不变。我做错了什么?

enter image description here

1 个答案:

答案 0 :(得分:1)

您要合并的密钥(国家/地区名称)在“数据面板”中重复(请参阅至少提及 5 次的“阿富汗”),并且可能也在“数据”中重复,这会导致问题。

尝试使用不同的技术(v-lookup),像这样(“国家名称”在“数据”中必须是唯一的):

for country in data["Country name"].values:
    indicator = data.loc[data["Country name"] == country, "Regional indicator"].item()
    datapanel.loc[datapanel["Country name"] == country, "Regional indicator"] = indicator
相关问题