合并同一行中的数据框

时间:2020-07-23 13:41:55

标签: python pandas dataframe web-scraping

我有一个python代码,可从数据框(df1)获取链接,从网站收集数据并在新的数据框中返回输出

df1:

id   Name      link             Country        Continent  
1    Company1  www.link1.com    France         Europe
2    Company2  www.link2.com    France         Europe
3    Company3  www.Link3.com    France         Europe

代码的输出是df2:

link           numberOfPPL      City  
www.link1.com       8            Paris
www.link1.com       9            Paris
www.link2.com       15           Paris
www.link2.com       1            Paris

我想将这两个数据框合并为一个(最终)。我的代码:

dfinal = df1.append(df2, ignore_index=True)

我得到了决赛:

    link           numberOfPPL      City       id   Name     Country  Continent
   www.link1.com       8            Paris
   www.link1.com       9            Paris
   www.link2.com       15           Paris
   www.link2.com       1            Paris
   www.link1.com                               1    Company1  France   Continent
   ..
   ..

我希望我的最终数据框像这样

    link           numberOfPPL      City       id   Name     Country  Continent
   www.link1.com       8            Paris      1    Company1  France  Europe
   www.link1.com       9            Paris      1    Company1  France  Europe
   www.link2.com       15           Paris      1    Company1  France  Europe
   www.link2.com       1            Paris      2    Company2  France  Europe

任何人都可以帮忙吗??

1 个答案:

答案 0 :(得分:2)

您可以在“链接”上合并两个数据框:

outputDF = df2.merge(df1, how='left', on=['link'])