我正在将多个数据源合并在一起,需要从最终结果中删除某些电子邮件地址。
我可以从我的数据源中删除单个字符串:
$hash->{elem}
我可以删除从数据帧生成的字符串列表:
to_drop = ['string 1', '@something.com']
drop_df = pd.DataFrame(db_cust_df[~db_cust_df['email'].str.contains
('|'.join(to_drop))])
如何使用相同的命令将它们全部删除?我应该将这些列表合并在一起吗?
new_drop_list = db_var_df['email'].tolist()
new_df = pd.DataFrame(drop_df[~drop_cust_df['email'].str.contains
('|'.join(new_drop_list))])
以上合并效果很好,但我想知道是否有更好的方法?