我目前有一个大约2000万行的MySQL表,我需要修剪它。我想删除updateTime
(插入时间戳)超过一个月的每一行
前。我没有亲自对表的顺序进行任何更改,因此数据应按照插入顺序排列,并且UNIQUE
和{{1}两个字段上有id
个键}。我将如何在短时间内完成这项工作?
答案 0 :(得分:13)
有两种方法可以删除大量行。首先有明显的方法:
DELETE FROM table1 WHERE updateTime < NOW() - interval 1 month;
第二种(稍微复杂一点)方法是创建一个新表并复制要保留的数据,截断旧表,然后将行复制回来。
CREATE TABLE table2 AS
SELECT * FROM table1 WHERE updateTime >= NOW() - interval 1 month;
TRUNCATE table1;
INSERT INTO table1
SELECT * FROM table2;
当您要删除大量行并且希望保留相对较小的数字时,使用TRUNCATE
要比带有DELETE
子句的WHERE
快得多。
答案 1 :(得分:13)
你可以承受多少停机时间?行有多大?你删除了多少?
简而言之,删除行是您可以对表执行的最昂贵的事情之一。总的来说这只是一个可怕的事情。
如果您不必这样做,并且您有足够的磁盘空间,并且您的查询不受表大小的影响(索引良好的查询通常会忽略表大小),那么您可能只留下足够的空间单独
如果您有机会并且可以使表离线(并且您正在删除表中的一小部分),那么您最好的选择是将要保留的行复制到新表中,放弃旧表一,将新的名称重命名为旧名称,然后重新创建索引。
否则,你几乎坚持使用'删除'。
答案 2 :(得分:0)
使用限制拆分删除可能会加快进程;
我不得不删除10M行并发出命令。它几个小时都没有响应。
我杀了查询(花了几个小时)
然后拆分删除。
DELETE from table where id > XXXX limit 10000;
DELETE from table where id > XXXX limit 10000;
DELETE from table where id > XXXX limit 10000;
DELETE from table where id > XXXX limit 10000;
然后我在一个文件中复制了这个语句并使用了该命令。
mysql> source /tmp/delete.sql
这要快得多。
您也可以尝试使用pt-tools等工具。和pt-archiver。
答案 3 :(得分:0)
实际上,即使你不能让表离线很长时间,你仍然可以使用'重命名表'技术去除旧数据。
停止进程写入表。
rename table tableName to tmpTableName;
create table tableName like tmpTableName;
set @currentId=(select max(id) from tmpTableName);
set @currentId=@currentId+1;
set @indexQuery = CONCAT("alter table test auto_increment = ", @currentId);
prepare stmt from @indexQuery;
execute stmt;
deallocate prepare stmt;
启动进程写入表。
insert into tableName
select * from tmpTableName;
drop table;
tableName的新插入将从正确的索引开始;旧数据将插入正确的索引中。