Pantaho excel将多张纸输入一张

时间:2015-05-28 12:28:40

标签: pentaho data-integration

我想将我的Excel输入(带有多个工作表)转换为另一个excel输出,但只有一个工作表。但是在我的输出文件中,我对不同的数据有一个问题。

这是我的输入文件:

Sheet 1中

date       data1    data2
01/01/2015  1        9
02/01/2015  2        6
03/01/2015  3        3
04/01/2015  4        2
05/01/2015  5        5

Sheet 2中

date        data3
01/01/2015  2
02/01/2015  3
03/01/2015  6
04/01/2015  9
05/01/2015  8

和输出文件:

date               data1    data2   data3
01/01/2015 00:00    1,00    9,00
02/01/2015 00:00    2,00    6,00
03/01/2015 00:00    3,00    3,00
04/01/2015 00:00    4,00    2,00
05/01/2015 00:00    5,00    5,00    
01/01/2015 00:00    2,00        
02/01/2015 00:00    3,00         
03/01/2015 00:00    6,00        
04/01/2015 00:00    9,00        
05/01/2015 00:00    8,00        

但在我的情况下,我希望得到这个输出:

date                data1   data2   data3
01/01/2015 00:00    1,00    9,00    2,00
02/01/2015 00:00    2,00    6,00    3,00
03/01/2015 00:00    3,00    3,00    6,00
04/01/2015 00:00    4,00    2,00    9,00
05/01/2015 00:00    5,00    5,00    8,00

所以日期是重复的,值drom data3在data1的值之后。

你能帮助我,因为我是Pentaho的新手,我不知道如何解决这个问题。

由于

1 个答案:

答案 0 :(得分:1)

您可以按照以下方式执行此操作。 enter image description here

Microsoft Excel Input获取第一张数据,Microsoft Excel Input 2获取第二张数据。 Merge Join您可以使用从两张纸上获得的日期字段进行连接。您将按预期获得结果。