Question

我正在尝试对我的熊猫数据框应用多种功能，这是从其他内部脚本中调用的。但是，在应用它们时，代码会变得很长，我认为这通常不是一种好的工程实践：

df['data_udo_product_brand_mode'] = df['data_udo_product_brand'].fillna(
        '[]').apply(think_preprocessing.create_list).apply(think_math.get_mode).apply(lambda x: x.strip('"').lower())

是否有比上述方法更有效，更好的方法将多个函数应用于数据框/数据框列？

谢谢！

Answer 1

可能有一种方法，但是这里可以做一件事，就是可以将lambda函数分离出来，以免代码变长。例如：

#Lowering character and removing spaces
strip_lower = lambda x: x.strip('"').lower()

df['data_udo_product_brand_mode']=df['data_udo_product_brand'].fillna('[]').apply(think_preprocessing.create_list).apply(think_math.get_mode).apply(strip_lower)

如何有效地将多个功能应用于数据框？

1 个答案: