如何在Pentaho Data Integration(Kettle)中合并两个文件

时间:2014-04-07 08:46:24

标签: pentaho kettle data-integration

我正在使用Pentaho Data Integration(Kettle),我有一个问题。

我有两个输入文件file1.txtfile2.txt,标题相同:

  • file1.txt

    NAME;AGE
    alberto;22
    angela;22
    madelaine;23
    
  • file2.txt

    NAME;AGE
    carlos;56
    fernando;30
    ana;16
    

我想将两个文件合并为一个files_together.txt

NAME;AGE
alberto;22
angela;22
madelaine;23
carlos;56
fernando;30
ana;16

我已经尝试了所有(我认为)并且我不知道该怎么做。我一直在Google,Youtube上搜索......没有正面的匹配。

非常感谢。

4 个答案:

答案 0 :(得分:1)

答案;只需将要合并的每个文件的输出作为最后一个文件的输入。

答案 1 :(得分:0)

我正在尝试与.csv文件类似的东西。尝试了你的建议,但它对我不起作用。许多其他博客说:“最好使用Excel脚本,然后使用Pentaho数据集成(Kettle)。”这不是真的。

您可以使用转换流类别下的“追加流”步骤。这需要两个输入合并它为您提供预期的合并文件。您还可以执行此步骤以将更多数量的文件合并到一起。

答案 2 :(得分:0)

我个人发现“追加流”更有用,因为它将流保持在一起。通过将两个输入指向一个输出,它们并行运行,因此结果将交错,具体取决于各种因素。使用Append Stream将为您提供file1的结果,然后从输出中的file2得到结果。

答案 3 :(得分:0)

您必须“选择值”步骤。字段名称必须相同。