如何使用Pentaho验证一个csv数据与另一个csv文件进行比较?

时间:2018-04-25 08:14:28

标签: pentaho kettle pentaho-spoon pentaho-data-integration

我有两个csv文件。 在一个文件中,我有10行,在另一个数据列表中。 我想要做的是,检查第一个csv的一个字段的数据,并将其与另一个csv文件进行比较。 那我该怎么做呢? 任何帮助都会很棒。

1 个答案:

答案 0 :(得分:0)

您正在寻找的步骤命名为Stream Lookup步骤。

读取CSV和参考文件,然后将这两个流放入Stream Lookup并按如下方式设置: a)查找步骤=读取参考的步骤 b)Keys / field =包含能够识别参考文件中的行的任何字段的CSV字段的名称。 c)Keys / Lookup字段=参考文件中字段的名称。 d)要检索的字段=要返回的引用中的字段名称(可能是您需要的标识符或任何其他字段) e)要检索的字段/类型=不要忘记!

就像那样,您将从参考文件中添加一列到CSV文件的10行。然后,您可以通过测试新列的值是否为空来过滤掉Lookup未找到的行。

在PDI中,所有上述设置都以下拉列表为指导,它需要2分钟。

enter image description here