如何快速修剪大表?

时间:2010-07-11 16:47:21

标签: mysql database pruning

我目前有一个大约2000万行的MySQL表,我需要修剪它。我想删除updateTime(插入时间戳)超过一个月的每一行

前。我没有亲自对表的顺序进行任何更改,因此数据应按照插入顺序排列,并且UNIQUE和{{1}两个字段上有id个键}。我将如何在短时间内完成这项工作?

4 个答案:

答案 0 :(得分:13)

有两种方法可以删除大量行。首先有明显的方法:

DELETE FROM table1 WHERE updateTime < NOW() - interval 1 month;

第二种(稍微复杂一点)方法是创建一个新表并复制要保留的数据,截断旧表,然后将行复制回来。

CREATE TABLE table2 AS
SELECT * FROM table1 WHERE updateTime >= NOW() - interval 1 month;

TRUNCATE table1;

INSERT INTO table1
SELECT * FROM table2;

当您要删除大量行并且希望保留相对较小的数字时,使用TRUNCATE要比带有DELETE子句的WHERE快得多。

答案 1 :(得分:13)

你可以承受多少停机时间?行有多大?你删除了多少?

简而言之,删除行是您可以对表执行的最昂贵的事情之一。总的来说这只是一个可怕的事情。

如果您不必这样做,并且您有足够的磁盘空间,并且您的查询不受表大小的影响(索引良好的查询通常会忽略表大小),那么您可能只留下足够的空间单独

如果您有机会并且可以使表离线(并且您正在删除表中的一小部分),那么您最好的选择是将要保留的行复制到新表中,放弃旧表一,将新的名称重命名为旧名称,然后重新创建索引。

否则,你几乎坚持使用'删除'。

答案 2 :(得分:0)

使用限制拆分删除可能会加快进程;

我不得不删除10M行并发出命令。它几个小时都没有响应。

我杀了查询(花了几个小时)

然后拆分删除。

DELETE from table where id > XXXX limit 10000;
DELETE from table where id > XXXX limit 10000;
DELETE from table where id > XXXX limit 10000;
DELETE from table where id > XXXX limit 10000;

然后我在一个文件中复制了这个语句并使用了该命令。

mysql> source /tmp/delete.sql 

这要快得多。

您也可以尝试使用pt-tools等工具。和pt-archiver。

答案 3 :(得分:0)

实际上,即使你不能让表离线很长时间,你仍然可以使用'重命名表'技术去除旧数据。

停止进程写入表。

rename table tableName to tmpTableName;
create table tableName like tmpTableName;
set @currentId=(select max(id) from tmpTableName);
set @currentId=@currentId+1;
set @indexQuery = CONCAT("alter table test auto_increment = ", @currentId);
prepare stmt from @indexQuery;
execute stmt;
deallocate prepare stmt;

启动进程写入表。

insert into tableName
select * from tmpTableName;
drop table;

tableName的新插入将从正确的索引开始;旧数据将插入正确的索引中。