我想用系列过滤大型数据框。我听说加入/合并是最快的方式。我想使用系列中的值(而不是索引)来过滤数据框的索引。这是我的代码和错误
pd.merge(df_customer, interested_customers, left_index=True, how='inner')
错误:
ValueError: can not merge DataFrame with instance of type <class 'pandas.core.series.Series'>
这是连接功能:
df_customer.join(interested_customers, how='inner', left_index=True)
这是错误:
join() got an unexpected keyword argument 'left_index'
如果我带走了left_index,我会得到一个空的数据帧。虽然它们匹配值
答案 0 :(得分:0)
假设您在customer
DF中有df_customer
作为索引:
df_customer.loc[interested_customers]
答案 1 :(得分:0)
pd.merge(df_customer, pd.DataFrame(interested_customers, columns = ['name_of_merging_column']), left_index=True, how='inner')
OR
df_customer.join(interested_customers.astype(int), how='inner', left_index=True)
OR
df_customer[df_customer.index.isin([interested_customers])]