我有一个python代码,可从数据框(df1)获取链接,从网站收集数据并在新的数据框中返回输出
df1:
id Name link Country Continent
1 Company1 www.link1.com France Europe
2 Company2 www.link2.com France Europe
3 Company3 www.Link3.com France Europe
代码的输出是df2:
link numberOfPPL City
www.link1.com 8 Paris
www.link1.com 9 Paris
www.link2.com 15 Paris
www.link2.com 1 Paris
我想将这两个数据框合并为一个(最终)。我的代码:
dfinal = df1.append(df2, ignore_index=True)
我得到了决赛:
link numberOfPPL City id Name Country Continent
www.link1.com 8 Paris
www.link1.com 9 Paris
www.link2.com 15 Paris
www.link2.com 1 Paris
www.link1.com 1 Company1 France Continent
..
..
我希望我的最终数据框像这样:
link numberOfPPL City id Name Country Continent
www.link1.com 8 Paris 1 Company1 France Europe
www.link1.com 9 Paris 1 Company1 France Europe
www.link2.com 15 Paris 1 Company1 France Europe
www.link2.com 1 Paris 2 Company2 France Europe
任何人都可以帮忙吗??
答案 0 :(得分:2)
您可以在“链接”上合并两个数据框:
outputDF = df2.merge(df1, how='left', on=['link'])