我想将多个CSV文件合并到pentaho勺子中的一个CSV文件中。 例如
file1.txt具有值
姓名,地址
ABC,浦
file2.txt具有值
电子邮件,年龄
ABC @ gmail.com,25
现在我希望输出在一个csv文件中
姓名,地址,电子邮件,年龄
请帮帮我..
答案 0 :(得分:5)
您正在寻找Merge Join步骤。
为了合并来自两个不同数据流的数据,他们需要有一个共同的密钥才能加入,因此我建议使用类似" ID"或类似的。
合并加入只需要从csv文件中获取ID的Key字段。然后,您可以将数据传递到文本文件输出,并排除ID,如果您不想在最终结果中使用它。
<强> FILE1.TXT 强>
Id,Name,Address
1,abc,Washington
2,Noah,Philadelphia
<强> FILE2.TXT 强>
Id,Email,Age
1,e@mail.me,25
2,noah@email,50
<强> RESULTS.TXT 强>
Name,Address,Email,Age
abc,Washington,e@mail.me,25
Noah,Philadelphia,noah@email,50
转化设置
合并加入步骤