我有一个皮重和压缩的csv文件。所以我有test.tar.gz.
我想通过文本文件输入来读取csv文件
我尝试 tar:gz:file://C:/test/test.tar.gz!/test.tar!
使用通配符,例如 ".*\.csv"
。
但它有时候无法读懂成功
它抛出异常
org.apache.commons.vfs.FileNotFolderException:
Could not list the contents of
"tar:gz:file:///C:/test/test.tar.gz!/test.tar!/"
because it is not a folder.
我使用windows8.1,pdi 5.2
哪里可能是错的?
答案 0 :(得分:1)
对于压缩文件csv读取,Pentaho Kettle中的“文本文件输入”步骤仅支持压缩文件夹内的第一个文件(在Zip / GZip文件中)。检查压缩部分中的Pentaho Wiki。
现在针对您的问题,尝试删除通配符,因为只会读取zip / gzip文件中的第一个文件。 (如上所述)
我已经放置了包含阅读zip和gzip文件的示例代码。检查here。
希望有所帮助:)