pentaho列级验证

时间:2013-10-07 09:16:44

标签: pentaho kettle

我是Pentaho项目的新手。需要了解一些验证规则是否可以由PDI处理。 我的输入数据是CSV格式,目标是ORACLE表。假设列的总数为50。

验证规则:

  • 如果来自输入文件(如48)的列数少于我们 应通过电子邮件通知
  • 如果有更多数量的列来自输入文件(如54)我们 应通过电子邮件通知
  • 如果输入文件中有任何重复的列,我们应该 通过电子邮件通知
  • 如果输入文件中有关于目标表的缺失顺序 布局我们应该通过电子邮件通知
  • 如果有任何列以数字开头,我们应通过电子邮件通知
  • 如果有任何超过30个字符的列我们应该 通过电子邮件通知

感谢任何帮助。

如果我需要任何要求,请回复。

2 个答案:

答案 0 :(得分:1)

经过大量的R& D之后,可以通过在转换中的Utility下添加“元数据结构”并将所有列列表加载到文本文件中来完成。

然后创建一个Job,并通过File Management下的“File Compare”将该文本文件与查找文本文件(包含所有目标列列表)进行比较。如果为true则进行检查选项,然后调用最终转换或如果False发送电子邮件通知。

答案 1 :(得分:0)

是。有一些步骤可以让您识别所有这些事情。

更一般地说,如果您想在Kettle中执行某些操作并且没有看到可以轻松完成的步骤,您始终可以使用自定义Java或JavaScript代码编写自定义步骤或步骤来执行此操作