如何将重复索引条目的数据框与具有唯一索引条目的数据框合并?

时间:2016-03-20 20:23:44

标签: python pandas dataframe stata

我有两个数据框

enter image description here

其中一个数据帧有一个重复的索引,我想将它们与另一个不同的数据帧连接起来。例如

Dataframe I =

[ index  column1]
leb       Lebanon
iso        iso1
CAN         Canda

DataFrame I2 =

[ index  column1]
leb       ra
CAN        ba
CAN         gell

我想将它们合并为

Dataframe Itot =

DataFrame I2=
[ index  column1     column2]
leb       ra          Lebanon
CAN        ba           Canada
CAN         gell       canada

这是Stata中的多对一合并,正如可以看到的那样 http://www.stata.com/manuals13/dmerge.pdf p.7。

1 个答案:

答案 0 :(得分:0)

考虑这个DataFrame

  df = pd.DataFrame({'Year': [2010,2009,2008],
                       'population_A': ['101597.0', '101416.0', '101342.0'], 
                       'Country':['Aruba', 'Aruba', 'Aruba']})

    df = df.set_index(['Country'])
    df

考虑其他非重复数据帧

df1 = pd.DataFrame({'Country':['Aruba','Afghanistan','Africa','Lebanon'], 'iso3c':['ABW','AFG','AFR','LEB']})
df1 = df1.set_index(['Country'])
df1

为此,我们需要第一个数据帧的索引不同于国家说的id 0,1,2,...

df.reset_index(level=0, inplace=True)
df
df.join(df1, on='Country')

这就是它