我正在尝试消除超过7百万行的表格的重复行。
为此,我使用此命令添加索引:
ALTER IGNORE TABLE DOBR ADD UNIQUE INDEX IDOBITO (PK1, DATEOC, DATENS, IDMUNRE, IDMUNOC, DATEINS);
我使用以下选择验证了重复的行:
select PK1, count(*) from DOBR group by PK1, DATEOC, DATENS, IDMUNRE, IDMUNOC, DATEINS having count(*) > 1
在我添加索引之前,我曾经有大约17,000个重复行,但现在我仍然有187个重复行。为什么?当我添加索引时,它们不应该被淘汰?