过滤具有多列的数据集时的MemoryError

时间:2018-06-13 15:11:40

标签: python python-3.x pandas memory-management out-of-memory

我有一个数据集,其中我的虚拟变量之一是dummified非常大(超过20,000列),当我尝试进一步对它进行基本的pandas操作时,它给了我一个MemoryError。

就像一个例子(这对于一个有200列的数据框很容易,但给我的MemoryError有20,000列):

Leads.loc[(Leads['Account Status']=='Won-Booked')]

在这种情况下我该怎么做?

0 个答案:

没有答案