如何在Pentaho中合并流?

时间:2016-06-02 13:50:07

标签: merge pentaho kettle

我有一份工作,将三个Excel文件从FTP加载到本地驱动器,然后启动三个不同的转换进行som规范化等,然后再将数据输出到Excel,最后再将它们放到FTP站点:< / p>

这是主要工作:

Main job

主要作业从三个开始,每个从一个Excel文件转换为另一个。每个输出Excel文件只是具有相同列数的数据的行。我想做的是将行合并到一个文件中。

East conversion

如何做到这一点?

2 个答案:

答案 0 :(得分:1)

您还可以尝试“附加流”步骤。 同样,所有Excel输入都必须具有匹配的元数据才能生效。 Append Streams

答案 1 :(得分:0)

只要流元数据完全匹配,Pentaho中的所有步骤都可以采用多个输入。因此,请确保所有三个Excel输入都具有完全匹配的元数据,这意味着字段名称,数据类型和字段顺序必须完全相同,然后将输出流式传输到相同的步骤,如下所示:

Merging Streams

注意,不会订购列。这就像SSIS中的$data = array( 'name' => $name, 'email' => $email, 'country' => $country, 'phone' => $phone, 'compid' => $compID ); $this->db->insert('people', $data); 步骤一样。如果您已对输入进行排序并希望对输出进行排序,请使用Union All步骤。