我开始大量使用pandas数据帧,我对算术效率有疑问。
在大多数情况下,我的数据帧是从左到右构建的,在该数据帧的末尾添加新列,而新列是根据df中已有的值构建的。现在,它仅取决于行,没有聚合。
我的问题是,最有效的方法是什么?我喜欢构建函数以包含我的算法。因此,我应该构建一个采用单个值的函数,然后使用
.apply(lambda x: my_func(x['col']), axis=1)
还是应该使功能偏离系列?那我可以说
df['new']=my_func(df['col'])
谢谢!