我是ETL的新手,需要一些帮助:
我有一个生成CSV提取的现有映射。为此,我必须添加一个新列,该列派生自当前数据提取的数据。
我有大约7个条件要检查,例如:
colA不为空,colB>' 7/1 / 2006',colC!='实施' colD in(' dsa',' cpu')等。
让我们说我目前在我的摘录中有大约100条记录。我现在必须在我的最终提取中添加一个新列,以便仅在满足所有上述条件时生成此新列的值。否则新列将具有NULL值。
我该如何实现?
我应该编写查询还是使用exp或过滤器?
答案 0 :(得分:0)
您可以使用表达式转换完成此操作。 在表达式中添加一个新的新列,并将逻辑放入其中。 现在将表达式转换中的列映射到目标中的新列。
有两种获取NULL值的方法 1)在if else逻辑中,在else部分中将其设为NULL 2)您可以在表达式中使用列默认值。