df1具有92851行×6列,并且
df2具有92851行×3列。
但是当我尝试将两个数据帧合并为一个时,基数为255089行×7列。它应该是92851行x 7列。
为什么会这样?
df=pd.merge(df1,df2,on=['source','destination'])
答案 0 :(得分:0)
您可以使用join
代替合并。
SCALA代码
val newDF = df1
.join(df2, Seq("source", "destination"), "left_outer")
PYTHON代码
newDF = df1
.join(df2, ['source', 'destination'], 'left_outer')