如何减少大型Excel文件的访问时间?

时间:2015-02-06 10:12:33

标签: python excel python-3.x xlrd

我想用Python处理机械测试设备的大型数据集。该设备的软件仅允许将数据导出为Excel文件。因此,我使用的xlrd包适用于小型*.xlsx文件。

我遇到的问题是,当我想通过

打开一个通用数据集(3-5 MB)时
  xlrd.open_workbook(path_wb)

访问时间约为30s至60s。是否有更有效和更快捷的方式来访问Excel文件?

2 个答案:

答案 0 :(得分:0)

您可以通过PyPyODBC作为数据库访问该文件,这可能(或可能不会)更快 - 您必须尝试并比较结果。

此方法适用于.xls.xlsx个文件。不幸的是,它有几个警告:

  1. 据我所知,这将仅适用于Windows 计算机,因为您依赖于Microsoft Jet数据库驱动程序。
  2. Microsoft Jet数据库驱动程序可能相当错误,尤其是日期。
  3. 无法创建或修改 Excel文件(PyPyODBC exceltests.py文件中的注释说明:I have not been able to successfully create or modify Excel files.)。您的问题似乎表明您只对阅读文件感兴趣,所以希望这不会有问题。

答案 1 :(得分:0)

我只是发现它实际上并不是访问时间的问题,但我在同一步骤中创建了一个对象。现在,通过单独创建对象,一切都运行得很快。