Question

当我执行“SELECT * FROM table”时，我得到如下结果：

1 item1 data1
2 item1 data2
3 item2 data3
4 item3 data4

如您所见，第2列有重复记录（第1项被重复）。那么我怎么能得到这样的结果：

1 item1 data1
2 item2 data3
3 item3 data4

副本中只返回一条记录以及其他唯一记录。

Answer 1

您可以使用SELECT DISTINCT或GROUP BY来执行此操作。

SELECT DISTINCT a, c
FROM table_c

或

SELECT a, b
FROM table_c
GROUP BY a, b

如果您想使用某些聚合函数，例如GROUP BY或COUNT()

，

SUM()会更有帮助

SELECT a, b, count(*)
FROM table_c
GROUP BY a, b

SELECT a, b, sum(d)
FROM table_c
GROUP BY a, b

Answer 2

如果您只需要删除重复项，请使用DISTINCT。 GROUP BY应该用于将聚合运算符应用于每个组

GROUP BY v DISTINCT

Answer 3

这取决于您要为每个唯一项目返回哪个rown。您的数据似乎表明SQL Server的此实例中的最小数据值。

SELECT item, min(data)
FROM  table
GROUP BY item

Answer 4

只使用内部联接，因为group by赢得了不包含在聚合函数中的多个列。

SELECT a.*
FROM yourtable a
INNER JOIN 
  (SELECT yourcolumn,
    MIN(id) as id
  FROM yourtable 
  GROUP BY yourcolumn
) AS b
  ON a.yourcolumn= b.yourcolumn
  AND a.id = b.id;

Answer 5

我发现如果由于任何原因我不能使用DISTINCT，那么GROUP BY将起作用。

Answer 6

您可以使用4种方法：

DISTINCT
组别
子查询
具有ROW_NUMBER（）的公用表表达式（CTE）

考虑以下带有测试数据的示例TABLE：

/** Create test table */
CREATE TEMPORARY TABLE dupes(word text, num int, id int);

/** Add test data with duplicates */
INSERT INTO dupes(word, num, id)
VALUES ('aaa', 100, 1)
      ,('bbb', 200, 2)
      ,('ccc', 300, 3)
      ,('bbb', 400, 4)
      ,('bbb', 200, 5)     -- duplicate
      ,('ccc', 300, 6)     -- duplicate
      ,('ddd', 400, 7)
      ,('bbb', 400, 8)     -- duplicate
      ,('aaa', 100, 9)     -- duplicate
      ,('ccc', 300, 10);   -- duplicate

选项1：SELECT DISTINCT

这是最简单直接的方法，也是最有限的方法：

SELECT DISTINCT word, num 
FROM    dupes
ORDER BY word, num;

/*
word|num|
----|---|
aaa |100|
bbb |200|
bbb |400|
ccc |300|
ddd |400|
*/

选项2：GROUP BY

分组允许您添加聚合数据，例如min(id)，max(id)，count(*)等

SELECT  word, num, min(id), max(id), count(*)
FROM    dupes
GROUP BY word, num
ORDER BY word, num;

/*
word|num|min|max|count|
----|---|---|---|-----|
aaa |100|  1|  9|    2|
bbb |200|  2|  5|    2|
bbb |400|  4|  8|    2|
ccc |300|  3| 10|    3|
ddd |400|  7|  7|    1|
*/

选项3：子查询

使用子查询，您可以先标识要忽略的重复行，然后使用WHERE NOT IN (subquery)构造在外部查询中将其过滤掉：

/** Find the higher id values of duplicates, distinct only added for clarity */
    SELECT  distinct d2.id
    FROM    dupes d1
        INNER JOIN dupes d2 ON d2.word=d1.word AND d2.num=d1.num
    WHERE d2.id > d1.id

/*
id|
--|
 5|
 6|
 8|
 9|
10|
*/

/** Use the previous query in a subquery to exclude the dupliates with higher id values */
SELECT  *
FROM    dupes
WHERE   id NOT IN (
    SELECT  d2.id
    FROM    dupes d1
        INNER JOIN dupes d2 ON d2.word=d1.word AND d2.num=d1.num
    WHERE d2.id > d1.id
)
ORDER BY word, num;

/*
word|num|id|
----|---|--|
aaa |100| 1|
bbb |200| 2|
bbb |400| 4|
ccc |300| 3|
ddd |400| 7|
*/

选项4：带有ROW_NUMBER（）的公用表表达式

在公用表表达式（CTE）中，选择ROW_NUMBER（），按组列划分并以所需顺序排序。然后仅选择具有ROW_NUMBER() = 1的记录：

WITH CTE AS (
    SELECT  *
           ,row_number() OVER(PARTITION BY word, num ORDER BY id) AS row_num
    FROM    dupes
)
SELECT  word, num, id 
FROM    cte
WHERE   row_num = 1
ORDER BY word, num;

/*
word|num|id|
----|---|--|
aaa |100| 1|
bbb |200| 2|
bbb |400| 4|
ccc |300| 3|
ddd |400| 7|
*/

Answer 7

要获取结果中的所有列，您需要放置以下内容：

SELECT distinct a, Table.* FROM Table

它会将 a 作为第一列，其余的将是与您的定义顺序相同的所有列。这样， a 列将重复。

Answer 8

选择Eff_st 从（选择EFF_ST，ROW_NUMBER（）over（PARTITION BY eff_st）XYZ - 来自ABC.CODE_DIM

）其中XYZ = 1 按EFF_ST排序仅获取前5行

如何通过SQL选择唯一记录

8 个答案:

选项1：SELECT DISTINCT

选项2：GROUP BY

选项3：子查询

选项4：带有ROW_NUMBER（）的公用表表达式