熊猫数据框高效算法

时间:2020-03-03 21:59:57

标签: python python-3.x pandas dataframe

我开始大量使用pandas数据帧,我对算术效率有疑问。

在大多数情况下,我的数据帧是从左到右构建的,在该数据帧的末尾添加新列,而新列是根据df中已有的值构建的。现在,它仅取决于行,没有聚合。

我的问题是,最有效的方法是什么?我喜欢构建函数以包含我的算法。因此,我应该构建一个采用单个值的函数,然后使用

.apply(lambda x: my_func(x['col']), axis=1)

还是应该使功能偏离系列?那我可以说 df['new']=my_func(df['col'])

谢谢!

0 个答案:

没有答案