如何删除重复的行并保留第一行?

时间:2011-05-23 21:23:49

标签: mysql sql sql-delete

我犯了一个错误,我有不必要的重复。

我有一个包含4个关键字段的表格。 A1k1k2k3

A1是自动增量和主键。

k1k2k3的组合应该是唯一的,我必须在创建唯一索引之前删除重复的行。有些行有一个副本,有些行有很多。

SELECT CONCAT(k1, k2, k) AS dup_value
  FROM myviews
 GROUP BY dup_value
HAVING (COUNT(dup_value) > 1)

显示了我需要处理的重复值。但现在我不知道如何保留一个并删除每个重复集的其余部分。

4 个答案:

答案 0 :(得分:15)

备份您的数据,然后......

MySQL supports JOINs in DELETE statements。如果你想保留第一个重复项:

DELETE a
  FROM MYVIEWS a
  JOIN (SELECT MIN(t.a1) AS min_a1, t.k1, t.k2, t.k3
          FROM MYVIEWS t
      GROUP BY t.k1, t.k2, t.k3
        HAVING COUNT(*) > 1) b ON b.k1 = a.k1
                              AND b.k2 = a.k2
                              AND b.k3 = a.k3
                              AND b.min_a1 != a.a1

如果您想保留最后一个重复项:

DELETE a
  FROM MYVIEWS a
  JOIN (SELECT MAX(t.a1) AS max_a1, t.k1, t.k2, t.k3
          FROM MYVIEWS t
      GROUP BY t.k1, t.k2, t.k3
        HAVING COUNT(*) > 1) b ON b.k1 = a.k1
                              AND b.k2 = a.k2
                              AND b.k3 = a.k3
                              AND b.max_a1 != a.a1

答案 1 :(得分:2)

您可以创建一个具有相同结构但是为空的新表,然后在其上创建唯一键,然后将原始表INSERT IGNORE / SELECT * FROM放入新表中,然后删除原始表表

INSERT IGNORE会自动忽略任何主要或唯一的密钥问题,只需跳过重复项。

答案 2 :(得分:2)

这样的东西?

DELETE FROM myviews WHERE EXISTS(SELECT CONCAT(k1, k2, k) AS dup_value
FROM myviews
GROUP BY dup_value
HAVING (COUNT(dup_value) > 1));

答案 3 :(得分:0)

你的concat函数需要一个分隔符,因为否则“a”,“b”和“cd”与“abcd”,“”,“”相同。