未实现read_excel的chunksize关键字

时间:2017-07-27 08:38:16

标签: python pandas

在版本0.16.1中,chunksize参数可用。

请参阅:http://pandas.pydata.org/pandas-docs/version/0.16.1/generated/pandas.ExcelFile.parse.html

但是在最新版本中,它不可用。

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.ExcelFile.parse.html

它被移除的原因是什么?

另外,我应该如何处理最新版本的块中的excel文件?

我曾经在下面做过:

import pandas as pd

excel = pd.ExcelFile("test.xlsx")

for sheet in excel.sheet_names:
    reader = excel.parse(sheet, chunksize=1000)
    for chunk in reader:
        # process chunk

1 个答案:

答案 0 :(得分:1)

在评论中解释EdChum时,此功能已在0.17.0中删除。 Chris在评论中给出了相同的原因:

  

没有超级令人信服的理由;主要想法是与之匹配   to_excel的api,即" ExcelFileWrapper" (ExcelFile,ExcelWriter)   没有任何特定于熊猫的功能,而是传递它   进入io函数(read_excel,to_excel)。

     

我确实更新了文档以涵盖该具体示例。编辑:虽然   在下面的差异中可能很难看到。

来源:https://github.com/pandas-dev/pandas/pull/11198

我仍然想知道是否有其他方法可以在块中读取excel?