我有一张具有7Gb数据的Excel工作表。我无法直接从ms_excel中打开它。我想将Excel文件切成较小的文件。我尝试了在线工具以及离线工具。有什么建议吗?
谢谢。
答案 0 :(得分:1)
这正是sxl的工作。它可以遍历大型Excel文件,而无需将其全部加载到内存中。
来自项目的readme:
安装完成后,您可以执行以下操作来遍历整个文件,而无需占用大量内存:from sxl import Workbook wb = Workbook("filepath") ws = wb.sheets['sheet name'] # or, for example, wb.sheets[1] for row in ws.rows: print(row)
该示例仅打印行,但是您将想要执行将要执行的任何处理。如果需要存储数据以备后用,则有多种选择,例如写入多个较小的Excel工作簿。写入数据库;写入CSV或其他文本文件;等