我犯了一个错误,我有不必要的重复。
我有一个包含4个关键字段的表格。 A1
,k1
,k2
,k3
。
A1
是自动增量和主键。
k1
,k2
和k3
的组合应该是唯一的,我必须在创建唯一索引之前删除重复的行。有些行有一个副本,有些行有很多。
SELECT CONCAT(k1, k2, k) AS dup_value
FROM myviews
GROUP BY dup_value
HAVING (COUNT(dup_value) > 1)
显示了我需要处理的重复值。但现在我不知道如何保留一个并删除每个重复集的其余部分。
答案 0 :(得分:15)
MySQL supports JOINs in DELETE statements。如果你想保留第一个重复项:
DELETE a
FROM MYVIEWS a
JOIN (SELECT MIN(t.a1) AS min_a1, t.k1, t.k2, t.k3
FROM MYVIEWS t
GROUP BY t.k1, t.k2, t.k3
HAVING COUNT(*) > 1) b ON b.k1 = a.k1
AND b.k2 = a.k2
AND b.k3 = a.k3
AND b.min_a1 != a.a1
如果您想保留最后一个重复项:
DELETE a
FROM MYVIEWS a
JOIN (SELECT MAX(t.a1) AS max_a1, t.k1, t.k2, t.k3
FROM MYVIEWS t
GROUP BY t.k1, t.k2, t.k3
HAVING COUNT(*) > 1) b ON b.k1 = a.k1
AND b.k2 = a.k2
AND b.k3 = a.k3
AND b.max_a1 != a.a1
答案 1 :(得分:2)
您可以创建一个具有相同结构但是为空的新表,然后在其上创建唯一键,然后将原始表INSERT IGNORE
/ SELECT * FROM
放入新表中,然后删除原始表表
INSERT IGNORE
会自动忽略任何主要或唯一的密钥问题,只需跳过重复项。
答案 2 :(得分:2)
这样的东西?
DELETE FROM myviews WHERE EXISTS(SELECT CONCAT(k1, k2, k) AS dup_value
FROM myviews
GROUP BY dup_value
HAVING (COUNT(dup_value) > 1));
答案 3 :(得分:0)
你的concat函数需要一个分隔符,因为否则“a”,“b”和“cd”与“abcd”,“”,“”相同。