熊猫更有效地合并

时间:2020-06-25 14:55:04

标签: python pandas

我有多个表需要在我的代码中合并,但是所有表都附加了很多“ fluff”列。我当前的表格合并过程如下:

df = pd.merge(df, df2, on=[key])
df = pd.drop([[insert not-needed columns], axis=1)
df = df.rename(columns={'column_x': 'column'})

我还看到人们首先在新的查找表中隔离列:

ref = df2['column1','key']
df = pd.merge(df, ref, on=[key])

在熊猫中,有没有一种更快的方法来执行类似于VLOOKUP(但包括多个列)的操作?

1 个答案:

答案 0 :(得分:0)

是的,您可以在merge之前对其进行过滤,这应该比在merge之后进行过滤的速度更快

ref = df2[['col1','col2',...., 'coln','key']]
df = pd.merge(df, ref, on=[key])