用于导入多个gzip文件取消归档和创建计算字段的Talend工作流程

时间:2017-03-24 08:30:33

标签: etl talend

我想1)从路径中读取多个gzip文件,2)取消归档,3)创建一个计算字段。到目前为止,我已经成功地做了1和2.对于3,我认为tMap将做必要的事情,但是不知道为什么我无法用tMap连接un-archive组件。

enter image description here

EDIT1: 我不知道为什么tdelemited和tMap会显示错误消息?

enter image description here

下面是我收到的消息     在2017年4月4日09:36开始工作Migration_1。

[statistics] connecting to socket on port 3336
[statistics] connected
[statistics] disconnected
Job Migration_1 ended at 09:36 04/04/2017. [exit code=0]

Edit2:我尝试了所有建议的步骤,但它没有给我所需的输出,令我惊讶的是,日志中没有任何错误消息可以调试任何内容。

enter image description here     在2017年4月12日12:36开始工作Migration_1。

[statistics] connecting to socket on port 3463
[statistics] connected
[statistics] disconnected
Job Migration_1 ended at 12:36 04/04/2017. [exit code=0]

1 个答案:

答案 0 :(得分:1)

tFileUnarchive将只取消归档zip文件,但您仍然必须阅读这些zip文件中包含的文件。 tFileUnarchive组件不提供此读取部分。

在tFileList - > tFileUnarchive子工作之后,您应该有一个文件读取子工作,例如:

tFileList--iterate-->tFileInput*-->tMap

应将tFileList设置为读取解压缩gzip文件的存储库。