pentaho-更新标志值基于2个数据流的比较结果

时间:2017-07-10 03:04:31

标签: pentaho pdi

我有样本数据集1和设置2作为附加图像,我想比较集1与集2数据,它的键(sectionid,itemid和rid)是相同的,寻找logdatetime,和将flagvalue('1',早期的logdatetime)从第2组更新为第1组,penatho pdi的哪些步骤可以帮助我实现这个目标?

Sample Data

1 个答案:

答案 0 :(得分:1)

您正在寻找的步骤称为Merge Row (diff)

给定两个数据流,指定键(sectionid,itemid和rid)和要比较的值(logdatetime)。然后PDI将新字段设置为相同,更改,新建或删除。或者当然新的取决于Set1或Set2中的哪一个被定义为"引用"。

两句谨慎的话:

  1. 两个流必须具有相同的格式(字段名称,顺序和类型):使用Select Value步骤。

  2. 两个流必须按指定的键排序:使用Sort row步骤。