比方说,我有一个包含很多重复值的表。我想分别删除每个列的重复项。使用DISTINCT
会删除列的重复组合,因此其他列仍包含重复的值。
原始表是:
Col1 | Col2 | Col3
-----+------+------
a1 | b1 | c1
a1 | b2 | c1
a2 | b1 | NULL
a2 | b2 | c1
a3 | b1 | c1
a3 | NULL | NULL
我的愿望结果是:
Col1 | Col2 | Col3
-----+------+------
a1 | b1 | c1
a2 | b2 | NULL
a3 | NULL | NULL
我可以通过几个查询分别获得此结果:
SELECT DISTINCT Col1
FROM TABLE
SELECT DISTINCT Col2
FROM TABLE
SELECT DISTINCT Col3
FROM TABLE
但是如何在单查询中将其返回到一个结果集中呢?
谢谢
答案 0 :(得分:0)
我会使用group by
...
;WITH c1 AS (
SELECT col1
, ROW_NUMBER() OVER (ORDER BY col1) AS [r]
FROM #foo
WHERE col1 IS NOT NULL
GROUP BY col1
)
, c2 AS (
SELECT col2
, ROW_NUMBER() OVER (ORDER BY col2) as [r]
FROM #foo
WHERE col2 IS NOT NULL
GROUP BY col2
)
, c3 AS (
SELECT col3
, ROW_NUMBER() OVER (ORDER BY col3) as [r]
FROM #foo
WHERE col3 IS NOT NULL
GROUP BY col3
)
select c1.col1
, c2.col2
, c3.col3
from c1 LEFT join c2
on c1.r = c2.r
left join c3
on c1.r = c3.r
ORDER BY c1.r ASC;
从问题描述中我不太确定您想要什么。我是根据提供的理想输出来制作的。
这是我使用的示例数据集。
CREATE TABLE #foo (
col1 char(2)
, col2 char(2)
, col3 char(2)
);
INSERT INTO #foo (col1, col2, col3)
VALUES ('a1', 'b2', null)
, ('a1', 'b1', 'c1')
, ('a2', Null, 'c1')
, ('a2', 'b1', null)
, ('a3', null, 'c1')
GO
这是查询的数据集和输出:
希望这会有所帮助!
答案 1 :(得分:-1)
您可以一起UNION
这三个查询:
SELECT DISTINCT Col1 FROM TABLE
UNION
SELECT DISTINCT Col2 FROM TABLE
UNION
SELECT DISTINCT Col3 FROM TABLE
这要求所有三个字段都具有相同的类型(不能混合数字,字符串和日期)。
这闻起来很糟糕。如果发现自己经常合并这些元素,则可以将表更改为看起来像UNION的结果。