删除重复项 - SQL server 2000-2005

时间:2010-08-24 03:41:20

标签: sql sql-server tsql sql-server-2000

仅针对MSSQL 2000-2005的SQL查询而没有存储过程

没有游标和临时表

表格

create table my_table
(
row_id int identity(1,1),
_key varchar(20),
_total decimal(18,2)
)

插入数据

insert into my_table (_key,_total) Values('qwe',10)
insert into my_table(_key,_total) Values ('qwe',10)
insert into my_table(_key,_total) Values ('asd',10)
insert into my_table(_key,_total) Values('asd',10)
insert into my_table(_key,_total) Values('zxc',10)
insert into my_table(_key,_total) Values('zxc',10)
insert into my_table(_key,_total) Values('qwe',100)
insert into my_table(_key,_total) Values('qwe',100)
insert into my_table(_key,_total) Values('asd',100)
insert into my_table(_key,_total) Values('asd',100)
insert into my_table(_key,_total) Values('zxc',100)
insert into my_table(_key,_total) Values('zxc',100)
insert into my_table(_key,_total) Values('qwe',50)
insert into my_table(_key,_total) Values('qwe',50)
insert into my_table(_key,_total) Values('asd',50)
insert into my_table(_key,_total) Values('asd',50)
insert into my_table(_key,_total) Values('zxc',50)
insert into my_table(_key,_total) Values('zxc',50)

我需要按_key字段删除重复项,并保留最多_total的行,其中包含最大的row_id。

我需要获得此结果集

8 qwe 100.00
10 asd 100.00
12 zxc 100.00

3 个答案:

答案 0 :(得分:1)

要删除它们,我认为“删除重复项”意味着:

DELETE FROM dbo.my_table
 WHERE NOT EXISTS(SELECT NULL                       
                    FROM dbo.my_table x
                    JOIN (SELECT _key,
                                  MAX(_total) AS max_total
                             FROM dbo.my_table
                         GROUP BY _key) y ON y._key = x._key
                                         AND y.max_total = x._total 
                   WHERE x._key = my_table._key
                     AND x._total = my_table._total
                GROUP BY x._key, x._total
                  HAVING MAX(x.row_id) = my_table.row_id)

选择列出的行的查询是:

  SELECT MAX(x.row_id),
         x._key,
         x._total
    FROM dbo.my_table x
    JOIN (SELECT _key,
                 MAX(_total) AS max_total
            FROM dbo.my_table
        GROUP BY _key) y ON y._key = x._key
                      AND y.max_total = x._total 
GROUP BY x._key, x._total

答案 1 :(得分:0)

如果您首先用简明的语言表达您想要的内容,那就更容易了

  • 找到最大row_id per(每个键的最大总数)

......变成......

  • 找到每个键的最大总数
  • 加入后找到最大row_id per(key,max(total))组合

我没有运行这个......我会留下你找到任何遗失的逗号等等

SELECT
    MAX(row_id) AS MaxRowid, M._key, M._total
FROM
    (
    SELECT 
        _key, max(_total) AS TTotal
    FROM
        my_table
    GROUP BY
        _key
    ) foo
    JOIN
    my_table M ON foo._key = M._key AND foo.TTotal = M._total
GROUP BY
    M._key, M._total

对于SQL Server 2005+,我可以使用CTE进行多样化

;WITH cFoo AS
(
   SELECT
      row_id, _key, _total, 
      ROW_NUMBER() OVER (PARTITION BY _key ORDER BY _total DESC, row_id DESC) AS bar
)
SELECT
    row_id, _key, _total
FROM
    cFoo
WHERE
    bar = 1

答案 2 :(得分:0)

您可以使用两个查询来实现此目的:

--Delete all lesser total duplicates
delete T1
from My_Table T1, My_Table T2
where T1._key = T2._key
and T1._total < T2._total

--Delete all equal total with lesser row_id duplicates
delete T1
from My_Table T1, My_Table T2
where T1._key = T2._key
and T1.row_id < T2.row_id