熊猫:我想将两列乘以1900万行,但是系统内存不足(内存错误)

时间:2019-02-22 03:03:43

标签: python-3.x pandas dataframe

我想将两列与1900万行相乘,然后将其添加到新列中。

例如,我有一个列col_X和一个列col_Y,其中有1900万条记录。 col_X的值类型为'float',而col_Y的值类型为'numpy.float64'。我想将它们相乘并将值添加到新列New_col中。我用于乘法的代码是:

df['New_col']=df['col_X']*df['col_Y']

当我处理1000万条记录时,这很好用。但是现在有1900万,我面临以下错误:

  

内存错误:(lambda x:op(x,rvalues))MemoryError)

我正在考虑将这两列分成两部分(即先乘以最初的一千万条记录,然后再乘以接下来的九百万条记录,然后再加入这两个系列并将其添加到新列中),但是我不知道该如何实施。还有其他解决方案吗?

我是Python的新手,非常感谢您的帮助。

0 个答案:

没有答案