在使用python在excel文件上管理非常简单的任务时,我遇到了一些问题。 excel文件大约20万行,大约40列,64 MB。
运行最基本的命令需要花费整整几分钟的时间,例如:
>>> import pandas as pd
>>> day = pd.to_datetime('1900-01-01')
>>> minute = pd.to_datetime('1900-01-01 09:45')
>>> second = pd.to_datetime('1900-01-01 09:45:55')
>>> subsecond = pd.to_datetime('1900-01-01 09:45:55.500597')
>>> assert subsecond > second
>>> assert minute < second
>>> assert day < minute
我应该停止使用openpyxl吗,我做错了什么? (我仍然是初学者)
答案 0 :(得分:0)
为此,我建议熊猫。我已经在熊猫中处理了600MB xlsx文件,没有任何问题。 https://realpython.com/working-with-large-excel-files-in-pandas/