Pentaho数据集成 - Excel Writer输出文件大小

时间:2016-03-01 11:47:24

标签: excel pentaho etl kettle pentaho-spoon

在使用Microsoft Excel Writer编写excel xlsx文件方面PDI效率低下。

如果手动转换数据,Pentaho输出中的转换后的Excel数据文件似乎是大小的三倍。是否预期效率低下,或者是否存在解决方法。

相同转换输出的CSV文件的大小更小。我配置错了吗?

1 个答案:

答案 0 :(得分:0)

xlsx文件的大小通常应小于CSV,因为它们包含以ZIP文件压缩的​​XML数据。 Pentaho的Microsoft Excel Writer使用org.apache.poi.xssf.streaming.SXSSFWorkbookorg.apache.poi.xssf.usermodel.XSSFWorkbook来编写xlsx文件,并创建压缩文件,因此这不应该是您的问题。

要检查您可以使用zip实用程序检查的文件,以查看文件大小和压缩率,以查看是否存在错误。您也可以尝试在Excel中打开文件并重新保存,以查看是否提供较小的大小,这可能表示效率低下。