带有ON DUPLICATE KEY UPDATE的MySQL LOAD DATA INFILE

时间:2013-03-07 12:25:46

标签: mysql load-data-infile on-duplicate-key

为了将大量数据加载到MySQL中,LOAD DATA INFILE是迄今为止最快的选择。不幸的是,虽然这可以以INSERT IGNORE或REPLACE的方式使用,但目前不支持ON DUPLICATE KEY UPDATE。

但是,ON DUPLICATE KEY UPDATE优于REPLACE。当存在重复时,后者执行删除和插入。这为密钥管理带来了开销。此外,自动增量ID在替换时不会保持不变。

使用LOAD DATA INFILE时如何模拟ON DUPLICATE KEY UPDATE

2 个答案:

答案 0 :(得分:78)

这些步骤可用于模拟此功能:

1)创建一个新的临时表。

CREATE TEMPORARY TABLE temporary_table LIKE target_table;

2)(可选)从临时表中删除所有索引以加快速度。

SHOW INDEX FROM temporary_table;
DROP INDEX `PRIMARY` ON temporary_table;
DROP INDEX `some_other_index` ON temporary_table;

3)将CSV加载到临时表

LOAD DATA INFILE 'your_file.csv'
INTO TABLE temporary_table
FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
(field1, field2);

4)使用ON DUPLICATE KEY UPDATE

复制数据
SHOW COLUMNS FROM target_table;
INSERT INTO target_table
SELECT * FROM temporary_table
ON DUPLICATE KEY UPDATE field1 = VALUES(field1), field2 = VALUES(field2);

5)删除临时表

DROP TEMPORARY TABLE temporary_table;

使用SHOW INDEX FROMSHOW COLUMNS FROM此流程可以针对任何给定的表自动执行。

答案 1 :(得分:2)

我们可以在(Jan)共享的过程中用下面的单个查询替换第一个(两个步骤)。

1)和2)我们可以创建具有相同参考结构且没有任何索引的新表。

CREATE TEMPORARY TABLE temporary_table SELECT * FROM target_table WHERE 1 = 0;

而不是..

1)创建一个新的临时表。

CREATE TEMPORARY TABLE temporary_table LIKE target_table;

2)(可选)从临时表中删除所有索引以加快速度。

显示来自temporary_table的索引; DROP INDEX PRIMARY ON temporary_table; DROP INDEX some_other_index ON temporary_table;