我正在尝试对我的熊猫数据框应用多种功能,这是从其他内部脚本中调用的。但是,在应用它们时,代码会变得很长,我认为这通常不是一种好的工程实践:
df['data_udo_product_brand_mode'] = df['data_udo_product_brand'].fillna(
'[]').apply(think_preprocessing.create_list).apply(think_math.get_mode).apply(lambda x: x.strip('"').lower())
是否有比上述方法更有效,更好的方法将多个函数应用于数据框/数据框列?
谢谢!
答案 0 :(得分:0)
可能有一种方法,但是这里可以做一件事,就是可以将lambda函数分离出来,以免代码变长。例如:
#Lowering character and removing spaces
strip_lower = lambda x: x.strip('"').lower()
df['data_udo_product_brand_mode']=df['data_udo_product_brand'].fillna('[]').apply(think_preprocessing.create_list).apply(think_math.get_mode).apply(strip_lower)