Talend-从tLogRow / tSort提取文件名

时间:2018-07-12 16:21:04

标签: talend

我是Talend的新手,只是想尽一切努力。

问题陈述 我需要处理文件列表中的位置文件。需要首先识别最新文件,然后仅处理该文件。我能够识别出最新的文件。然后,我能够创建另一个处理位置文件的流程。问题在于将这两个流程结合在一起,这样我就可以识别最新的文件并对其进行处理。

到目前为止已尝试 一直试图从目录中的列表中提取最新文件。遍历所有文件,将其属性保留在缓冲区中。完成此子任务后,读取缓冲区,按降序的mime排序,提取顶部记录,并能够使用tLogRow打印。

除了我现在不知道如何为下一个任务使用文件名之外,其他一切似乎都很好。

我确信这是非常基本的内容,但老实说,我从很长一段时间以来一直在搜寻互联网/帮助,但没有成功。

任何指针都会有所帮助。

随函附上工作流程供您参考。

enter image description here

1 个答案:

答案 0 :(得分:1)

首先,您可以使用tFileList的功能来简化您的工作。它可以按文件的修改日期对文件进行排序:

enter image description here

接下来,使用tIterateToFlow将每次迭代转换为一行:

(String)globalMap.get("tFileList_1_CURRENT_FILEPATH")

tSampleRow,范围为“ 1”,以获取最新文件。

然后将结果存储在全局变量中。在下一个子作业中,只需将该全局变量用作tFileInputPositional中的文件名即可。

enter image description here