快速提问,这是我的数据 Data_field:100 |地址|地方| 456 | 687
表达式中的此列将传递给聚合器,并在聚合器中标记为group by。
这个聚合器的输出是什么?你能告诉我关于聚合器的简要介绍吗?
谢谢, Teja公司
答案 0 :(得分:0)
首先要说的是,例如,您的数据由3条记录组成
数据金额
100 |地址|地方| 456 | 687 10
100 |地址|地方| 456 | 687 20
100 |地址|地方| 456 | 687 30
在informatica中,如果它的数据组和SUM(金额),输出将是
100 |地址|地方| 456 | 687 60
例如,如果下面没有金额列,请说
100 |地址|地方| 456 | 687
100 |地址|地方| 456 | 687
100 |地址|地方| 456 | 687
在informatica中,如果其数据组在数据上,那么您的输出如下
100 |地址|地方| 456 | 687只有一条记录
在上面的场景中,关于聚合器的一个重要注意事项是,尽管如此 如果您没有选中groupby选项,则缺省情况下,informatica会选择最后一条记录
信息中的聚合器类似于使用聚合函数,例如“ MAX ”,“ MIN ”,“ COUNT ”等。在SQL
中示例:如果您想知道某个部门的最高工资,那么
SQL
按部门选择dept,count(*)来自员工组;
Informatica的
您可以在dept上启用groupby选项,然后创建一个具有max(salary)的端口。这将使输出类似于上面的SQL
要在聚合器中注意以获得更好的性能: 1)在聚合器之前使用分拣机转换
2)尽可能在组中使用数字列(尽量避免使用日期和字符串列)
3)如果源具有大量记录,则最好在SQL覆盖自身中对记录进行分组,因为聚合器将创建缓存。
4)如果需要,添加过滤器以避免不必要的聚合
希望这有帮助
此致
Raj
答案 1 :(得分:0)