我想通过Talend Data Preparation删除重复项,并且有一列名为:HOURS,我想计算它们之间的小时数,并删除电子邮件和姓名重复项,这是我的表格示例:
如您所见,我有很多用户名和电子邮件,但是我的工作时间并不相同,我想根据用户名和电子邮件将我的工作时间加在一起,并删除用户名和电子邮件的所有重复项同时。
答案 0 :(得分:0)
(我不是真的很喜欢Data Prep,所以也许有一个我不知道的内部解决方案)。
我认为您在Talend Data Preparation中不能通过SUM操作使用GROUP BY,因为该工具只能校正数据行,而不能进行聚合操作。
从Data Prep导出校正后的数据后,您将可以在Talend Data Integration中使用tAggregateRow对数据进行求和。