我正在开发维度表,requiremnet是插入所有可能的源属性的唯一组合。
step1:我使用row_number()函数获取源,将重复记录作为行号
第二步:条件拆分用于占用行== 1所以我在初始加载时从源中获取所有uniqe可能的记录,我也只考虑唯一记录。
第3步:查找从源到目标dim表的所有列。每次使用目标表查找组合都存在于目标暗表
中步骤4:如果不匹配,则将记录插入昏暗的表格中。
问题:来源:col1 col2 col3
'x' 'x' null
目标存在:col1 col2 col3
'x' 'x' null
我将不匹配的记录路径带到目标表,我期望不从查找中获取此记录,但是从查找中获取此记录。
查找组件仍然将行传递给目标,因此在目标dim表中形成了重复。
查找不会比较col3 null值比较以避免此记录插入。
可以提供有关如何避免查找中的空比较的任何信息。
感谢
prav
答案 0 :(得分:1)
我建议你使用查找来识别NULL和(空格)值。