我知道我最近问过几个与pentaho相关的问题,但我很想在短时间内对其进行评估:)
我想要克服的最新障碍是我正在构建一个工作,当它到达时将处理输入文件,但我只知道文件名的格式,而不是确切的文件名本身和“等待文件”步骤不允许使用通配符。对于这样一个步骤来说,这似乎是一个明显的暗示,所以我想知道我是否只是错过了一些东西,但在论坛等等,似乎我不是唯一面临这样一个挑战的人。
理想情况下,我需要“等待文件”步骤来搜索通配符/正则表达式,当找到匹配项时,将生成的文件名称传递给作业中的下一步进行处理。
有什么建议吗?
由于
汤姆
答案 0 :(得分:0)
我再次尝试回答你的问题。
实际上,您不需要等待文件的作业。根据我对国家/地区分割的回答:Pentaho Spoon - Output to multiple files based on field content,您只需要传递源名称,然后使用流程文件将其归档(请参见下面的图片)。
从这里开始,我认为你可以使用我之前提供的ktr(http://pentaho.phi-integration.com/kettle/kettle-files/split_countries.ktr)来调整我的逻辑。
然后,您可以使用作业调度程序控制作业的重复(等待和处理文件)(请参阅图片)。
嗯,希望这有助于汤姆!
此致
恐龙
答案 1 :(得分:0)
我有类似的要求,并通过创建专门用于接收文件的目录(来自远程主机)解决了这个问题。
“获取文件名”步骤读取目录中的文件并将名称传递给下一步。 “获取文件名”允许使用通配符,顺便说一句。
(当然,我已经完成处理文件后必须在输入队列中清理。)
编辑:我没有提到您使用“获取文件名”丢失了“唤醒”功能,并且您必须循环并安排定期解析目录。