为什么 Pandas 打开 .xls 文件扩展名比 .xlsx 更快

时间:2021-04-27 11:12:08

标签: python excel pandas xlsx xls

当我打开 .xls 格式 here 的 excel 文件时,它的打开速度比使用 Pandas 的 .xlsx 扩展名 here 更快。我正在使用 Pandas 1.0.1 和 Python 3.7.6。这些文件实际上是一样的,为了方便起见,我只是重命名了文件名和第一个工作表名称。这些文件由 6 个工作表组成,每张工作表中有 49 列和大约 1700 行数字数据。正如您所看到的,我在这里只读取了第一张纸,但对于任意数量的纸和行,结果都是一样的。 (几乎 4 倍的时差)

是这个原因吗? [来自 https://windowsfileviewer.com]

“虽然 XLS 文件使用专有的二进制格式,但 XLSX 文件使用称为 Open XML 的较新文件格式。Microsoft Excel 2003 及更早版本使用 XLS 扩展名,Microsoft Excel 2007 及更高版本使用 XLSX 扩展名”

我在 Panda 的官方文档中找不到任何信息。我只是想知道为什么以及如何发生这种情况。

1 个答案:

答案 0 :(得分:0)

可能是因为 XLS 文件使用专有的二进制格式,而 XLSX 使用称为 Open XML 的较新文件格式