我有两个数据框
其中一个数据帧有一个重复的索引,我想将它们与另一个不同的数据帧连接起来。例如
Dataframe I =
[ index column1]
leb Lebanon
iso iso1
CAN Canda
DataFrame I2 =
[ index column1]
leb ra
CAN ba
CAN gell
我想将它们合并为
Dataframe Itot =
DataFrame I2=
[ index column1 column2]
leb ra Lebanon
CAN ba Canada
CAN gell canada
这是Stata中的多对一合并,正如可以看到的那样 http://www.stata.com/manuals13/dmerge.pdf p.7。
答案 0 :(得分:0)
考虑这个DataFrame
df = pd.DataFrame({'Year': [2010,2009,2008],
'population_A': ['101597.0', '101416.0', '101342.0'],
'Country':['Aruba', 'Aruba', 'Aruba']})
df = df.set_index(['Country'])
df
考虑其他非重复数据帧
df1 = pd.DataFrame({'Country':['Aruba','Afghanistan','Africa','Lebanon'], 'iso3c':['ABW','AFG','AFR','LEB']})
df1 = df1.set_index(['Country'])
df1
为此,我们需要第一个数据帧的索引不同于国家说的id 0,1,2,...
df.reset_index(level=0, inplace=True)
df
df.join(df1, on='Country')
这就是它