我有一个带数据的输入文件
GGN,IBM
BNGLR,IBM
GGN,HCL
诺伊达,HCL
BNGLR,HCL
我想输出像
IBM,GGN,BNGLR
HCL,GGN,NOIDA,BNGLR
使用数据存储工具。
提前致谢
答案 0 :(得分:1)
你没有给我们提供太多的细节,所以我在你正在使用的工作(服务器/并行)和你的DataStage版本上做了一些假设。在作业设计中,我认为第一列的名称是“Value”,第二列是“Key”。
这是一个基本的工作设计,请注意分区:Job design image
这是第一个变压器设置。我知道仅为修剪添加第二个变换器是有用的,但LastRowInGroup()函数的一个限制是它只能接受列作为参数。因此,转换到它使用的列必须在函数传递之前完成:first transformer image
这是第二个变压器设置。阶段变量顺序很重要,不要忘记约束:Second transformer image
在第二个变换器中,请务必设置分区和约束,如图所示:second transformer properties image
您的输出数据如下所示:output stage data image
希望有帮助并且清楚,仔细查看图像。我正在使用图像,因为他们说的不仅仅是文字。
此致 山姆格里布尔 @InforgeAcademy