我有一个非常大(> 2百万行)的csv文件正在内部Web服务中生成和查看。问题是,当此系统的用户想要导出此csv以运行自定义查询时,他们会在excel中打开这些文件。 Excel正在尽可能地格式化数字,但是有些请求要求使用xlsx格式的数据和过滤器等等。
问题归结为:使用python2.7,如何将大型csv文件(> 200万行)读入excel(或多个excel文件)并控制格式? (日期,数字,自动过滤器等)
我对python和内部excel解决方案持开放态度。
答案 0 :(得分:2)
如果没有关于csv中数据类型的更多信息,或者您正确处理这些数据类型的确切问题,很难给出确切的答案。
但是,建议查看可在Python中用于创建xlsx文件的此模块(https://xlsxwriter.readthedocs.org/)。我没有使用它,但似乎有比你需要的更多的功能。
特别是如果您需要在多个文件或工作簿之间进行拆分。看起来您可以预先创建过滤器并完全控制格式化