我正在使用这两个pandas DataFrames:
t1 = pd.DataFrame(data=[['A',1], ['B', 2]])
t2 = pd.DataFrame(data=[['A',1], ['B', 2]])
请说明参数与内部和外部的连接如何对连接的数据框起作用
答案 0 :(得分:0)
在这种情况下,内部和外部都会给你相同的结果。
正如documentation所解释的那样,加入='外部'将连接并返回帧没有完全重叠的行,就你没有连接的轴上的索引而言,用NaN填充缺失值。
加入='内'只返回在你没有连接的轴上完全重叠的行。
t1 = pd.DataFrame(data={'letter':['A','B'], 'number':[1, 2]}, index=[1,2])
t2 = pd.DataFrame(data={'letter':['B','C'], 'number':[1, 2]}, index=[2,3])
pd.concat([t1,t2], join='outer', axis=1)
给出
letter number letter number
1 A 1.0 NaN NaN
2 B 2.0 B 1.0
3 NaN NaN C 2.0
pd.concat([t1,t2], join='inner', axis=1)
给出
letter number letter number
2 B 2 B 1