标签: pandas
在我注意到合并大型数据帧的同时,对right_df和left_df通用的值进行预过滤会大大促进计算的开展,例如:
right_df
left_df
common_values =left_df['key'].values left_df.merge(right_df[right_df['key'].isin(common_values)], on='key')
要快得多,即:
left_df.merge(right_df, on='key')
那是一种错误吗?