异常缓慢的简单大熊猫应用功能

时间:2019-02-01 14:41:04

标签: pandas

我有一个由3,373,612行组成的熊猫数据框。我想在两个列上运行一些代码以产生两个新列。我的代码引发了异常,因此,为了诊断原因,我已缩减为最简单的代码,我认为这需要一行并返回一系列两个值:

def split_ids(row):
    return pd.Series(None, None)

analytic_events.apply(split_ids, axis=1)

我正在Jupyter Notebook中运行此程序,但即使如此,我仍然感到震惊的是,五分钟后代码仍在运行。

我一定对大熊猫适用功能有些误解。为什么简单的代码要花费过多的时间才能遍历数据帧中的300万行?

0 个答案:

没有答案