我有一个由3,373,612行组成的熊猫数据框。我想在两个列上运行一些代码以产生两个新列。我的代码引发了异常,因此,为了诊断原因,我已缩减为最简单的代码,我认为这需要一行并返回一系列两个值:
def split_ids(row):
return pd.Series(None, None)
analytic_events.apply(split_ids, axis=1)
我正在Jupyter Notebook中运行此程序,但即使如此,我仍然感到震惊的是,五分钟后代码仍在运行。
我一定对大熊猫适用功能有些误解。为什么简单的代码要花费过多的时间才能遍历数据帧中的300万行?