查找作为另一个供应商数据库中的两个记录存在的一条记录

时间:2016-10-18 01:42:27

标签: sql-server database

我有两个供应商数据库多年来一直非常不同步,我正在努力纠正。单个客户可以有多个id_numbers,这两个供应商数据库中都存在这些ID。单个客户的所有ID都正确附加到Vendor1数据库中的一个客户记录(意味着它们属于同一个customer_code)。但问题是,这些相同的ID可能会在Vendor2数据库中的多个客户之间分配,这是不正确的。我需要在Vendor2数据库中将这些多个客户合并在一起。

我正在尝试确定哪些客户在第二个供应商数据库中表示为两个或更多客户。到目前为止,我已经将两者结合在了一起,但我无法弄清楚如何只找到对同一MemberInternalKeys有两个或更多不同customer_code的客户。

这是我到目前为止所拥有的:

select top 10
    c.customer_code,
    i.id_number,
    cc.MemberInternalKey
from Vendor1.dbo.customer_info as c
join Vendor1.dbo.customer_ids as i
  on c.customer_code = i.customer_code
join Vendor2.dbo.Clubcard as cc
  on (i.id_number collate Latin1_General_CI_AS_KS) = cc.ClubCardId
where i.id_code = 'PS'

在下面的示例中,我希望只返回表中的最后两行。前两行不应包含在结果中,因为它们对于两个记录都具有相同的MemberInternalKey并且属于相同的customer_code。由于两个供应商数据库之间存在1-1匹配,因此也不应包括第三行。

customer_code | id_number | MemberInternalKey
--------------|-----------|------------------
5549032       | 4000      | 4926877
5549032       | 4001      | 4926877
5031101       | 4007      | 2379218
2831779       | 4029      | 1763760
2831779       | 4062      | 4950922

非常感谢任何帮助。

2 个答案:

答案 0 :(得分:1)

如果我理解正确,你可以使用窗口函数来实现这个逻辑:

select c.*
from (select c.customer_code, i.id_number, cc.MemberInternalKey,
             min(MemberInternalKey) over (partition by customer_code) as minmik,
             max(MemberInternalKey) over (partition by customer_code) as maxmik
      from Vendor1.dbo.customer_info c join
           Vendor1.dbo.customer_ids i
           on c.customer_code = i.customer_code join
           Vendor2.dbo.Clubcard as cc
           on (i.id_number collate Latin1_General_CI_AS_KS) = cc.ClubCardId
      where i.id_code = 'PS'
     ) c
where minmik <> maxmik;

这会计算每个MemberInternalKey的最小值和最大值customer_code。外where然后只返回不同的行。

答案 1 :(得分:1)

另一种选择是

Declare @YourTable table (customer_code int, id_number int, MemberInternalKey int)
Insert Into @YourTable values
(5549032,4000,4926877),
(5549032,4001,4926877),
(5031101,4007,2379218),
(2831779,4029,1763760),
(2831779,4062,4950922)

Select A.*
 From  @YourTable A
 Join (
        Select customer_code
         From  @YourTable
         Group By customer_code
         Having min(MemberInternalKey)<>max(MemberInternalKey)
      ) B on A.customer_code=B.customer_code

返回

customer_code   id_number   MemberInternalKey
2831779         4029        1763760
2831779         4062        4950922