我尝试将基于ClusterID的记录组合在一起,以获得客户记录的丰富数据。
我如何使用MS SQL对以下内容进行分组? Coalesce不会工作,因为记录需要在同一行才能使其工作,如果我每个群集有超过2个匹配,那么它将是一个繁琐的处理。在所有列中使用max by ClusterId是我正在做的一种解决方法,但我希望有一种更有效的方法来实现这一点。
有:
ClusterID,CustomerNo,Name,Email,Mobile,Address,PostalCode,Passport,ProfileNo
100,NULL,Person,person@email.com,NULL,OfficeAdd,12345,NULL,123
100,456,Person,person@email.com,98765,HomeAdd,34567,P12345,NULL
**这是SSIS DQS匹配节点(https://ssisdqsmatching.codeplex.com/)的结果。它可以进行比赛,但无法处理幸存部分以获得金唱片。
想要:
ClusterID,CustomerNo,Name,Email,Mobile,Address,PostalCode,Passport,ProfileNo
100,456,Person,person@email.com,98765,OfficeAdd,12345,P12345,123
任何想法都会非常感激。谢谢!