如何使用SQL DISTINCT从多个列中删除重复项?

时间:2018-06-28 17:53:13

标签: sql distinct

比方说,我有一个包含很多重复值的表。我想分别删除每个列的重复项。使用DISTINCT会删除列的重复组合,因此其他列仍包含重复的值。

原始表是:

Col1 | Col2 | Col3    
-----+------+------
 a1  | b1   | c1    
 a1  | b2   | c1
 a2  | b1   | NULL
 a2  | b2   | c1    
 a3  | b1   | c1
 a3  | NULL | NULL

我的愿望结果是:

Col1 | Col2 | Col3    
-----+------+------
 a1  | b1   | c1    
 a2  | b2   | NULL    
 a3  | NULL | NULL

我可以通过几个查询分别获得此结果:

SELECT DISTINCT Col1 
FROM TABLE

SELECT DISTINCT Col2 
FROM TABLE

SELECT DISTINCT Col3 
FROM TABLE

但是如何在单查询中将其返回到一个结果集中呢?

谢谢

2 个答案:

答案 0 :(得分:0)

我会使用group by ...

;WITH c1 AS (
    SELECT col1
         , ROW_NUMBER() OVER (ORDER BY col1) AS [r]
      FROM #foo
     WHERE col1 IS NOT NULL
     GROUP BY col1
)
, c2 AS (
    SELECT col2
         , ROW_NUMBER() OVER (ORDER BY col2) as [r]
      FROM #foo
     WHERE col2 IS NOT NULL
     GROUP BY col2
)
, c3 AS (
    SELECT col3
         , ROW_NUMBER() OVER (ORDER BY col3) as [r]
      FROM #foo
     WHERE col3 IS NOT NULL
     GROUP BY col3
)
select c1.col1
     , c2.col2
     , c3.col3
  from c1 LEFT join c2
        on c1.r = c2.r
       left join c3
        on c1.r = c3.r
 ORDER BY c1.r ASC;

从问题描述中我不太确定您想要什么。我是根据提供的理想输出来制作的。

这是我使用的示例数据集。

CREATE TABLE #foo (
    col1 char(2)
  , col2 char(2)
  , col3 char(2)
);

INSERT INTO #foo (col1, col2, col3)
VALUES ('a1', 'b2', null)
     , ('a1', 'b1', 'c1')
     , ('a2', Null, 'c1')
     , ('a2', 'b1', null)
     , ('a3', null, 'c1')
GO

这是查询的数据集和输出:

enter image description here

希望这会有所帮助!

答案 1 :(得分:-1)

您可以一起UNION这三个查询:

SELECT DISTINCT Col1 FROM TABLE
UNION
SELECT DISTINCT Col2 FROM TABLE
UNION
SELECT DISTINCT Col3 FROM TABLE

这要求所有三个字段都具有相同的类型(不能混合数字,字符串和日期)。

这闻起来很糟糕。如果发现自己经常合并这些元素,则可以将表更改为看起来像UNION的结果。