我最近一直在处理大型数据集。首先,我在Windows机器上的jupyter笔记本上工作,在那里我创建了一个形状为(30072,15484)和数据类型为int32的数组,它能够成功创建它。但是,当我使用命令提示符在python控制台上运行相同的代码时,它给出了内存错误。为什么这样?
我正在运行以下行
pd.DataFrame(np.zeros((30000,15000),dtype=object))
答案 0 :(得分:0)
您正在将代码与dtype = object一起使用,这比简单的int32类型花费更多的时间来创建代码。我在PC上测试了您的代码,可以在vscode,jupyter和cmd上正常工作。尝试以下代码:
pd.DataFrame(np.zeros((30000,15000),dtype="int32"))