我们有一个包含三个字段的复合主键的表(它在MySQL 5.1中)。此表上每秒有近200个插入和200个选择,表的大小约为100万行,并且正在增加。
我的问题是:“复合主键”是否会降低此表上的插入和选择的性能?
我应该使用简单的自动增加INT ID字段而不是复合主键吗? (我认为答案与MySQL处理多列索引的方式非常相关)
答案 0 :(得分:53)
INSERT
和UPDATE
表现差别不大:(INT)
和(INT, INT)
键几乎相同。
SELECT
的 PRIMARY KEY
效果取决于很多因素。
如果您的表格为InnoDB
,则该表格会隐式聚类在PRIMARY KEY
值上。
这意味着如果两个值都包含密钥,则搜索这两个值的速度会更快:不需要额外的密钥查找。
假设您的查询是这样的:
SELECT *
FROM mytable
WHERE col1 = @value1
AND col2 = @value2
表格布局如下:
CREATE TABLE mytable (
col1 INT NOT NULL,
col2 INT NOT NULL,
data VARCHAR(200) NOT NULL,
PRIMARY KEY pk_mytable (col1, col2)
) ENGINE=InnoDB
,引擎只需要在表格中查找确切的键值。
如果您使用自动增量字段作为假id:
CREATE TABLE mytable (
id INT NOT NULL AUTO_INCREMENT PRIMARY KEY,
col1 INT NOT NULL,
col2 INT NOT NULL,
data VARCHAR(200) NOT NULL,
UNIQUE KEY ix_mytable_col1_col2 (col1, col2)
) ENGINE=InnoDB
,然后引擎首先需要在索引(col1, col2)
中查找ix_mytable_col1_col2
的值,从索引中检索行指针(id
的值)并制作另一个id
在表格中查找。
对于MyISAM
表,这没有区别,因为MyISAM
表是堆组织的,而行指针只是文件偏移量。
在这两种情况下,都会创建相同的索引(PRIMARY KEY
或UNIQUE KEY
),并且将以相同的方式使用。
答案 1 :(得分:22)
如果是InnoDB,复合主键将包含在每个二级索引的每个条目中。
这意味着
这些当然分别是一个缺点和优势。
复合主键不一定是坏的,有时它们真的很有用,因为InnoDB将它们聚集在一起 - 这意味着使用远远少于非需要的IO操作可以满足PK上的(光盘限制)范围扫描。 - 聚集索引。
当然,如果你在其他表中有外键,它们会更宽,而且需要包含主表中的全部键。
但总的来说,我会说平衡。拥有复合主键本身不会导致问题。但是,拥有“大”主键(例如大变量)可能会超过群集的优势并且能够使用覆盖索引。
答案 2 :(得分:3)
SELECT
,但效果几乎可以忽略不计,不值得担心。INSERT
的速度,你肯定做了足够的INSERT
来担心它。如果它是一个MyISAM表,而INSERT
锁定表,那么这比它是一个InnoDB表更令人担忧。如果通过使用auto_increment主键,您可以将这些列保留为未编制索引,那么您将从更改中受益。但是,如果你仍然需要保留这三列的索引(例如,如果你需要对它们的组合强制执行唯一性),那么在性能方面它不会为你做任何事情。