在水壶使用文本文件输入从tar.gz文件读取csv文件,但它没有工作。哪里可能是错的?

时间:2015-01-31 04:37:29

标签: pentaho kettle

我有一个皮重和压缩的csv文件。所以我有test.tar.gz.
我想通过文本文件输入来读取csv文件 我尝试 tar:gz:file://C:/test/test.tar.gz!/test.tar! 使用通配符,例如 ".*\.csv"
但它有时候无法读懂成功 它抛出异常

 org.apache.commons.vfs.FileNotFolderException: 
 Could not list the contents of 
 "tar:gz:file:///C:/test/test.tar.gz!/test.tar!/" 
  because it is not a folder.

我使用windows8.1,pdi 5.2
哪里可能是错的?

1 个答案:

答案 0 :(得分:1)

对于压缩文件csv读取,Pentaho Kettle中的“文本文件输入”步骤仅支持压缩文件夹内的第一个文件(在Zip / GZip文件中)。检查压缩部分中的Pentaho Wiki

现在针对您的问题,尝试删除通配符,因为只会读取zip / gzip文件中的第一个文件。 (如上所述)

我已经放置了包含阅读zip和gzip文件的示例代码。检查here

希望有所帮助:)