Datastage中基于场景的问题

时间:2018-10-29 08:16:50

标签: datastage

我在这里有两个基于场景的问题。

问题1

输入数据集

Col1

A

A

B

C

C

B

D

A

C

输出数据集

Col1 Col2

A 1

A 2

A 3

B 1

B 2

C 1

C 2

C 3

D 1

Question2

输入数据字符串 AA-BB-CC-DD-EE-FF(可以使用任何定界符,并且字符串可以具有任何长度)

输出数据字符串 字符串1-> AA

字符串2-> BB

字符串3-> CC

字符串4-> DD

感谢与问候, Subhasree

1 个答案:

答案 0 :(得分:0)

问题1:可以用变压器解决。对数据进行排序并使用lastrowingroup功能。 对于Col2,只需创建一个计数器作为阶段变量,然后为每行添加1-如果达到lastrowingroup,则用第二阶段变量将其重置。 或者,您可以在SQL中使用rownumber列。

问题2:您没有提供足够的信息。 string1是列还是行?如果您对结构(任何分隔符)一无所知,这将变得很困难...