在版本0.16.1中,chunksize
参数可用。
请参阅:http://pandas.pydata.org/pandas-docs/version/0.16.1/generated/pandas.ExcelFile.parse.html
但是在最新版本中,它不可用。
https://pandas.pydata.org/pandas-docs/stable/generated/pandas.ExcelFile.parse.html
它被移除的原因是什么?
另外,我应该如何处理最新版本的块中的excel文件?
我曾经在下面做过:
import pandas as pd
excel = pd.ExcelFile("test.xlsx")
for sheet in excel.sheet_names:
reader = excel.parse(sheet, chunksize=1000)
for chunk in reader:
# process chunk
答案 0 :(得分:1)
在评论中解释EdChum时,此功能已在0.17.0中删除。 Chris在评论中给出了相同的原因:
没有超级令人信服的理由;主要想法是与之匹配 to_excel的api,即" ExcelFileWrapper" (ExcelFile,ExcelWriter) 没有任何特定于熊猫的功能,而是传递它 进入io函数(read_excel,to_excel)。
我确实更新了文档以涵盖该具体示例。编辑:虽然 在下面的差异中可能很难看到。
来源:https://github.com/pandas-dev/pandas/pull/11198
我仍然想知道是否有其他方法可以在块中读取excel?