如果手动转换数据,Pentaho输出中的转换后的Excel数据文件似乎是大小的三倍。是否预期效率低下,或者是否存在解决方法。
相同转换输出的CSV文件的大小更小。我配置错了吗?
答案 0 :(得分:0)
xlsx文件的大小通常应小于CSV,因为它们包含以ZIP文件压缩的XML数据。 Pentaho的Microsoft Excel Writer
使用org.apache.poi.xssf.streaming.SXSSFWorkbook
和org.apache.poi.xssf.usermodel.XSSFWorkbook
来编写xlsx文件,并创建压缩文件,因此这不应该是您的问题。
要检查您可以使用zip实用程序检查的文件,以查看文件大小和压缩率,以查看是否存在错误。您也可以尝试在Excel中打开文件并重新保存,以查看是否提供较小的大小,这可能表示效率低下。