协助MySQL查询重复项

时间:2013-11-05 20:10:59

标签: mysql sql group-by duplicates sql-order-by

Table1
  Colum1
    ID      Name        Size
    1       File23      912831823
    2       File29      823472348
    3       File21      912831823
    4       File24      742834882

基本结构如上所示,现在我正在寻找大小的副本,因为有时会输入错误的名称。

SELECT Name, Size, COUNT(Size) AS Counted FROM Column1 GROUP BY Size HAVING (COUNT(Size)>1) ORDER BY Counted DESC

这给了我以下

            Name        Size        Counted
            File23      912831823   2

这是进步,因为它计算了重复大小的次数,即2.我的目标是 得到这样的输出列出每个重复项,但我不太确定如何格式化该查询。

            Name        Size        Counted
            File23      912831823   2
            File21      912831823   2

我尝试了一些不同的东西,甚至玩弄外部连接,但很明显我不知道我想要的是什么,谁能把我推向正确的方向? =)

2 个答案:

答案 0 :(得分:1)

您必须进行聚合计数,然后重新加入源表:

SELECT t1.Name, Counts.Size, Counts.Counted 
FROM
    (
    SELECT Size, COUNT(ID) as Counted
    FROM t1
    GROUP BY Size
    ) Counts

    LEFT JOIN t1 ON t1.Size = Counts.Size

答案 1 :(得分:0)

您可以通过使用聚合查询的连接来执行此操作:

select t1.*, agg.cnt
from table1 t1 join
     (SELECT Size, count(*) as cnt
      FROM table1
      GROUP BY Size
      HAVING COUNT(Size) > 1
     ) agg
     on t1.size = agg.size
order by agg.cnt desc, size desc;

子查询获取重复的大小。 join带回原始行。在大多数其他数据库中,您可以使用窗口/分析函数来完成此操作。