标签: python pandas
我注意到df.replace在计算上非常昂贵,并且使大型数据库/词典崩溃,所以现在我迭代进行。但是,对于列表,我尝试了此解决方案
df['listColumn'].apply(lambda x: [repl_dict[v] for v in x if v in repl_dict] if isinstance(x, list) else x)
它在低ram情况下工作非常快。因此,如果列只是单个字符串,那么现在我正在寻找等效项。如果该字符串在字典中,请用字典值替换它,否则删除该值。