我使用了RegexClean Transformation来清理我的数据
match : [!@#$%^&*_+`{};':,./<>?0123456789](?<empty>)
replace : ${empty}
它正在删除特殊字符,但唯一的问题是它给了我正确的行的空值所以我很困惑为什么这个错误确实发生
NUM VEH NAME NAME_Clean
1 CREDEUR CYNTHIA D NULL
2 FLUKE NANCY C NULL
017 1 CLARK, WILLIAM CLARK WILLIAM
037 2 DESORMEAUX, MICHELLE DESORMEAUX MICHELLE
043 1 FALCON, JENNIFER, FALCON JENNIFER
073 2 WINTERS, ALLEN WINTERS ALLEN
084 1 UNKNOWN NULL
094 2 UNKNOWN NULL
答案 0 :(得分:1)
我的快速假设是,因为它没有找到任何纠正,所以它返回NULL。如果组件中没有用于返回源值的选项,则需要在组件后面添加派生列,并使用一些逻辑创建一个带有ISNULL([NAME_Clean])?[NAME]:[NAME_Clean]
表达式的NAME_final列。这指定如果NAME_Clean列包含NULL,那么我们应该使用原始值。否则,请使用非null NAME_Clean。