我对Kettle Pentaho的转变称为Test。
此ETL过程应加载单个数据库的三个不同表,其中每个表都将其源代码放入另一个数据库的不同表中。
为此,我使用了三个table input steps
。每个人都连接到value mapper
,一个Select value step
,然后是Data Validator
,add sequence step
,最后是table output
。
总结每个表加载总共有六个步骤。 当我编辑决赛步骤时,我找到了一个我想要解决的问题,我拖动前面表格的字段加载。
例如,表A加载具有field bank_id
,在第二个表中它不存在,但在第二个加载过程的table output step
中,我可以选择此项,尽管我不想这样做。
有没有选项看不到以前的字段?这样我可以避免容易出错。特别是,当表格具有相同名称的字段时。
谢谢
修改
答案 0 :(得分:2)
屏幕截图非常清楚地说明了情况,现在答案很简单:
删除行之间的对角线跃点(箭头)。
PDI中的转换没有单一的起点或终点,因此您无需在一行中连接所有步骤。有三个独立的流就可以了。
转换中的所有步骤都是并行启动,然后在行进入时等待和处理行(或者在输入步骤的情况下,开始读取数据并在其输出跳跃中生成行)。这意味着你的三个流将根据它们自己从输入到输出的跳跃并行执行。
答案 1 :(得分:0)
添加选择值步骤,我用来经常添加过滤器步骤来“清理”流程