我是Pentaho的GeoKettle(Spoon)的新手,我目前从Excel文件到我的数据库。现在我想避免在我的数据库表中重复。这就是为什么我只想将那些行插入到我的数据库表中但尚未存在(在我的数据库表中只有唯一的记录)。
据我所知,有两种方法可以实现这一点。我尝试的第一种方法是使用插入/更新步骤(我已禁用更新功能)并定义了所有必须相同的列以便插入记录。但它不起作用。所有记录仍然插入数据库中。
这就是为什么我要尝试(根据pentaho)更快的选项,这是一个"表输出"使用"更新"错误处理步骤如图所示。
如图所示,箭头指向"表格输出"到"更新"是黑色的。但我需要一个红色点缀的步骤来处理错误。但我不知道如何创造这个。在教程中,我经常看到弹出一个带有2个选项的小窗口,如图所示:
但我没有得到那个弹出窗口。如果我想创建一个跃点,我将必须标记两个步骤并右键单击其中一个。 那么在哪种可能的方法中我可以创建这样的红色虚线箭头?最后,它必须如下所示:
提前非常感谢!!
答案 0 :(得分:1)
您的设置存在问题。或者使用您的PDI版本。错误步骤的功能在V4中引入,但完全针对V6的所有步骤实现。
从SourceForge下载新的PDI。 V7.1真的是一个强大而稳定的版本。解压缩并测试。
顺便说一下,你想要实现的是CRUD模式。用于创建,读取,更新,删除的CRUD。执行此操作的步骤Merge Rows (diff)
(在Joins
系列中)。您可以告诉要检查哪些列的步骤,并生成一个值为identical
,changed
,new
或deleted
的新列。您可以在Switch / Case
中重定向流以执行相应的操作。更多信息here (V4)。