我试图理解MyISAM如何实际存储其记录以及在记录插入和记录删除后如何维护其结构。我已阅读以下链接:
我想确定我是否理解正确,如果不对,请纠正我。
再次回顾问题
我想确定如果我理解正确,请纠正我 这是不对的。
其他问题
答案 0 :(得分:4)
您在有关MyISAM的问题中所掌握的信息是正确的。但是,我想解决您的另外两个问题:
如果用户使用较长的数据更新现有数据会怎样? MyISAM会将记录标记为已删除并找到适合新数据的位置,或者只是使用溢出指针指向不合适的数据吗?
根据the Book
第10章:“存储引擎”第196页第7段说
对于长度可变的记录,格式更复杂。第一个字节包含描述记录子类型的特殊代码。后续字节的含义因每个子类型而异,但常见的主题是存在一个字节序列,其中包含记录的长度,块中未使用的字节数,NULL值指示符标志以及可能的指针如果记录不适合以前创建的空间并且必须拆分,则继续记录。当一个记录被删除,并且要插入其位置的新记录超过原始记录大小时,就会发生这种情况。您可以通过研究storage / myisam / mi_dynrec.c中的switch语句in_mi_get_block_info()来获取不同代码含义的详细信息。
基于该段落,只有当要插入的新数据不适合先前分配的块时,旧记录才会被链接数据覆盖。这可能会导致许多膨胀的行。
如果表已被删除并多次插入,因为记录结构可能充满溢出指针和未使用的空间,这会非常低效吗?
根据我之前的回答,会有很多块
此类记录链接将从插入了超大数据的每一行的前面开始。这可能会很快膨胀MyISAM表.MYD
文件。
MyISAM的默认行格式为动态。当表是动态的并且经历了大量的INSERT,UPDATE和DELETE时,这样的表需要使用
进行优化OPTIMIZE TABLE mytable;
还有一种方法:将表格的行格式切换为固定格式。这样,所有行都是相同的大小。这就是你如何使行格式固定:
ALTER TABLE mytable ROW_FORMAT=Fixed;
即使使用固定行格式,也必须花时间查找可用记录,但时间将是O(1)搜索时间(在外行人看来,无论如何,找到可用记录需要相同的时间表有多少行或有多少删除的行)。您可以通过启用concurrent_insert来绕过该步骤,如下所示:
将此添加到my.cnf
[mysqld]
concurrent_insert = 2
不需要重启MySQL。跑吧
mysql> SET GLOBAL concurrent_insert = 2;
这会导致所有INSERT都转到表的后面而不寻找可用空间。
以下是关于SELECT的一些帖子,对于固定行格式
更快May 03, 2012
:Which is faster, InnoDB or MyISAM? Sep 20, 2011
:Best of MyISAM and InnoDB May 10, 2011
:What is the performance impact of using CHAR vs VARCHAR on a fixed-size field? 在大多数情况下,当您运行ALTER TABLE mytable ROW_FORMAT=Fixed;
时,该表可能会增长80-100%。 .MYI
文件(MyISAM表的索引页)也会以相同的速率增长。
如果你想要MyISAM表的速度并且可以使用更大的表格,那么我需要我的替代建议。如果要为每个MyISAM表节省空间,请保留行格式(动态)。您必须使用动态表格更频繁地压缩表格OPTIMIZE TABLE mytable;
。