我有一个get file names
步骤,其中一个正则表达式可以获得4个csv文件。
之后我有text file input
步骤设置csv的字段,并读取这些文件。
完成此步骤后,将执行Table output
步骤。
问题是text file input
似乎在一个语句中读取了所有4个文件,因此table output
语句会插入4个文件的行。所以我的输出表有20行(每个文件5个)
预期的beahivour读取一个文件,在输出表中插入文件的5行并执行sql脚本,将该表移动到最终表并截断临时表。现在重复第二个,第三个和最后一个文件的过程。
在加载文件的每个步骤中删除临时表,但最终表不是,它是增量的。
我怎么能在pentaho中做到这一点?
答案 0 :(得分:1)
将当前作业更改为每个传入记录执行一次的子工作。
在你需要的新主要工作中:
在subjob中,您必须使用Result中的Get Rows替换Get Filenames并重新配置包含文件名的字段。