如何使用Talend Data Preparation删除重复项?

时间:2019-12-23 11:08:36

标签: talend

我想通过Talend Data Preparation删除重复项,并且有一列名为:HOURS,我想计算它们之间的小时数,并删除电子邮件和姓名重复项,这是我的表格示例:

enter image description here

如您所见,我有很多用户名和电子邮件,但是我的工作时间并不相同,我想根据用户名和电子邮件将我的工作时间加在一起,并删除用户名和电子邮件的所有重复项同时。

1 个答案:

答案 0 :(得分:0)

(我不是真的很喜欢Data Prep,所以也许有一个我不知道的内部解决方案)。

我认为您在Talend Data Preparation中不能通过SUM操作使用GROUP BY,因为该工具只能校正数据行,而不能进行聚合操作。

从Data Prep导出校正后的数据后,您将可以在Talend Data Integration中使用tAggregateRow对数据进行求和。