在数据存储工具

时间:2018-05-07 05:50:50

标签: datastage

我有一个带数据的输入文件

GGN,IBM
BNGLR,IBM
GGN,HCL
诺伊达,HCL
BNGLR,HCL

我想输出像 IBM,GGN,BNGLR
HCL,GGN,NOIDA,BNGLR

使用数据存储工具。

提前致谢

1 个答案:

答案 0 :(得分:1)

你没有给我们提供太多的细节,所以我在你正在使用的工作(服务器/并行)和你的DataStage版本上做了一些假设。在作业设计中,我认为第一列的名称是“Value”,第二列是“Key”。

这是一个基本的工作设计,请注意分区:Job design image

这是第一个变压器设置。我知道仅为修剪添加第二个变换器是有用的,但LastRowInGroup()函数的一个限制是它只能接受列作为参数。因此,转换到它使用的列必须在函数传递之前完成:first transformer image

这是第二个变压器设置。阶段变量顺序很重要,不要忘记约束:Second transformer image

在第二个变换器中,请务必设置分区和约束,如图所示:second transformer properties image

您的输出数据如下所示:output stage data image

希望有帮助并且清楚,仔细查看图像。我正在使用图像,因为他们说的不仅仅是文字。

此致 山姆格里布尔 @InforgeAcademy