将大型Excel文件导入Python

时间:2015-04-13 21:34:37

标签: python openpyxl

我正在尝试将Excel(.xlsx)文件导入Spyder IDE。当我使用openpyxl导入小文件时,一切正常,但是对于这个特定的文件(大约30MB和800k行),我的系统崩溃了。

以下是导入代码的一部分:

from openpyxl import load_workbook 
wb = load_workbook(filename=path + 'cleaned_noTC_s_PERNO_Date.xlsx', data_only=True)

任何人都可以让我知道这种方法有什么问题,我可以用什么来导入指定的文件?

2 个答案:

答案 0 :(得分:1)

尝试使用优秀的pandas库,它具有非常强大的excel阅读功能,并且在我的经验中非常适合记忆:

请参阅here

import pandas as pd
xl = pd.read_excel("file.xlsx")

答案 1 :(得分:0)

听起来你的内存不足了。如果您不需要编辑文件,则可以使用read_only模式,否则您将需要更多内存。