将两个csv文件合并到pentaho勺子中的一个csv文件中

时间:2014-05-16 17:47:37

标签: csv pentaho etl

我想将多个CSV文件合并到pentaho勺子中的一个CSV文件中。 例如

file1.txt具有值

姓名,地址

ABC,浦

file2.txt具有值

电子邮件,年龄

ABC @ gmail.com,25

现在我希望输出在一个csv文件中

姓名,地址,电子邮件,年龄

请帮帮我..

1 个答案:

答案 0 :(得分:5)

您正在寻找Merge Join步骤。

为了合并来自两个不同数据流的数据,他们需要有一个共同的密钥才能加入,因此我建议使用类似" ID"或类似的。

合并加入只需要从csv文件中获取ID的Key字段。然后,您可以将数据传递到文本文件输出,并排除ID,如果您不想在最终结果中使用它。

我的测试数据(根据需要编辑加入类型)

<强> FILE1.TXT

Id,Name,Address
1,abc,Washington
2,Noah,Philadelphia

<强> FILE2.TXT

Id,Email,Age
1,e@mail.me,25
2,noah@email,50

<强> RESULTS.TXT

Name,Address,Email,Age
abc,Washington,e@mail.me,25
Noah,Philadelphia,noah@email,50

转化设置 Transformation Setup

合并加入步骤

Merge2