如何在多列中找到重复计数?

时间:2011-03-01 20:38:42

标签: sql database sql-server-2005 tsql

这是一个模仿我的场景的示例表:

COL_1   COL_2   COL_3   COL_4   LAST_COL
A       P       X       NY      10
A       P       X       NY      11
A       P       Y       NY      12
A       P       Y       NY      13
A       P       X       NY      14
B       Q       X       NY      15
B       Q       Y       NY      16
B       Q       Y       CA      17
B       Q       Y       CA      18

LAST_COL是主键,因此每次都会有所不同。

我想忽略LAST_COL并收集一些与4列其余部分相关的统计信息。

基本上,我的表中有数百万行,我想知道哪一组COL_1, COL_2, COL_3 and COL_4的行数最多。

所以,我想要一个查询,它可以输出所有唯一的行及其出现次数。

COL_1   COL_2   COL_3   COL_4   TOTAL
A       P       X       NY      3
A       P       Y       NY      2
B       Q       X       NY      1
B       Q       Y       NY      1
B       Q       Y       CA      2

感谢任何帮助我的人。

*我正在使用MS SQL,如果这会有所不同。

4 个答案:

答案 0 :(得分:9)

SELECT COL_1, COL_2, COL_3, COL_4, COUNT(*)
FROM MyTable
GROUP BY COL_1, COL_2, COL_3, COL_4

如果您想要清除没有重复的行:

SELECT COL_1, COL_2, COL_3, COL_4, COUNT(*)
FROM MyTable
GROUP BY COL_1, COL_2, COL_3, COL_4
HAVING COUNT(*) > 1

答案 1 :(得分:1)

GROUP BY 就是您想要的。例如:

SELECT COL_1, COL_2, COL_3, COL_4, COUNT(*)
FROM my_table
GROUP BY COL_1, COL_2, COL_3, COL_4

答案 2 :(得分:1)

如果我理解正确你所需要的是:

SELECT COL_1,COL_2,COL_3,COL_4, COUNT(*) AS TOTAL
FROM table
GROUP BY COL_1,COL_2,COL_3,COL_4

答案 3 :(得分:1)

  

拥有最多行数

所以你要计算,然后ORDER BY计数DESC

SELECT    COL_1, COL_2, COL_3, COL_4, COUNT(*) COUNT_ROWS
FROM      TBL
GROUP BY  COL_1, COL_2, COL_3, COL_4
ORDER BY  COUNT_ROWS DESC