我有两个很大的数据框(大约2000000行)
它们都有两个共同的列(“ CD”和“ BA”),我想在这两个列上加入我的数据框。
我有很多解决方案,但是目前它们都已经花了很长时间(超过7秒)
affect = df1.merge(df2, on=['BA', 'CD'], how='left')
affect = df1.set_index(['BA', 'CD']).join(df2.set_index(['BA', 'CD']), how='left')
df1.set_index(['BA', 'CD'], inplace=True)
df2.set_index(['BA', 'CD'], inplace=True)
affect = df1.join(df2, how='left')
您是否知道如何加快速度?