我有独立服务器和2000个在线用户(不是很多)。 带有表request_action的MySQL DB 5.6(没有自动增量BUT增量的复合PK在触发器中,您可以在下面看到):
CREATE TABLE `request_action` (
`ra_id` bigint(20) NOT NULL,
`cl_id` int(11) NOT NULL DEFAULT '0',
`ra_r_id` bigint(20) NOT NULL,
`ra_tr_id` bigint(20) DEFAULT '0',
`ra_ss_id` bigint(20) NOT NULL DEFAULT '0',
`ra_h_id` int(11) NOT NULL DEFAULT '0',
`ra_uch_id` bigint(20) DEFAULT '0',
`ra_u_id` int(11) DEFAULT '0',
`ra_datetime` datetime NOT NULL,
`ra_uct_id` int(11) NOT NULL DEFAULT '0',
`ra_text` longtext NOT NULL,
`ra_datetime_reply` datetime NOT NULL,
`ra_reply` longtext NOT NULL,
`ra_line_breaks` tinyint(4) NOT NULL DEFAULT '0',
`ra_plan` tinyint(4) NOT NULL DEFAULT '0',
`ra_shw` tinyint(4) NOT NULL DEFAULT '1',
`ra_to_u_id` int(11) DEFAULT '0',
`ra_created_at` datetime DEFAULT NULL,
`ra_seen` tinyint(4) NOT NULL DEFAULT '0',
`ra_seen_u_id` bigint(20) NOT NULL DEFAULT '0',
PRIMARY KEY (`cl_id`,`ra_id`),
KEY `rm_r_id` (`ra_r_id`),
KEY `ra_u_id` (`ra_u_id`),
KEY `ra_plan` (`ra_plan`),
KEY `ra_rat_id` (`ra_ss_id`),
KEY `ra_h_id` (`ra_h_id`),
KEY `ra_tr_id` (`ra_tr_id`),
KEY `ra_id` (`ra_id`),
KEY `ra_datetime` (`ra_datetime`,`ra_seen`),
KEY `ra_shw` (`ra_shw`,`ra_seen`,`ra_to_u_id`),
KEY `ra_r_id` (`ra_r_id`,`ra_tr_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
在此表上触发(在插入之前):
if (cast(NEW.ra_id as UNSIGNED) = 0) then
SET NEW.ra_id = (SELECT COALESCE(MAX(ra_id)+1, 1) FROM request_action WHERE cl_id = NEW.cl_id);
end if
而且我一天中多次陷入僵局((例如,一天100次。
LATEST DETECTED DEADLOCK
------------------------
2019-02-21 21:09:34 7f5e11f3b700
*** (1) TRANSACTION:
TRANSACTION 2947112777, ACTIVE 0 sec inserting
mysql tables in use 11, locked 11
LOCK WAIT 5 lock struct(s), heap size 1184, 3 row lock(s)
MySQL thread id 19952598, OS thread handle 0x7f5e10e38700, query id 248552715 192.168.0.7 vh_uon_com_ru
insert into request_action (
ra_r_id,
ra_u_id,
ra_datetime,
ra_text,
ra_datetime_reply,
ra_reply,
ra_plan,
cl_id,
ra_tr_id,
ra_ss_id,
ra_h_id,
ra_uch_id,
ra_to_u_id,
ra_uct_id,
ra_shw
) values (
40053,
906,
'2019-02-21 21:09:34',
'Звонок',
'2019-02-21 21:09:34',
'',
'0',
698,
0,
0,
0,
171114,
0,
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 2320 page no 546708 n bits 104 index `PRIMARY` of table `request_action` trx id 2947112777 lock_mode X locks gap before rec insert intention waiting
*** (2) TRANSACTION:
TRANSACTION 2947112774, ACTIVE 0 sec inserting
mysql tables in use 11, locked 11
5 lock struct(s), heap size 1184, 3 row lock(s)
MySQL thread id 19952597, OS thread handle 0x7f5e11f3b700, query id 248552705 192.168.0.7
insert into request_action (
ra_r_id,
ra_u_id,
ra_datetime,
ra_text,
ra_datetime_reply,
ra_reply,
ra_plan,
cl_id,
ra_tr_id,
ra_ss_id,
ra_h_id,
ra_uch_id,
ra_to_u_id,
ra_uct_id,
ra_shw
) values (
25182,
906,
'2019-02-21 21:09:34',
'Звонок',
'2019-02-21 21:09:34',
'',
'0',
698,
0,
0,
0,
171113,
0,
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 2320 page no 546708 n bits 104 index `PRIMARY` of table `request_action` trx id 2947112774 lock mode S locks gap before rec
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 2320 page no 546708 n bits 104 index `PRIMARY` of table `request_action` trx id 2947112774 lock_mode X locks gap before rec insert intention waiting
*** WE ROLL BACK TRANSACTION (2)
在my.cf中,我们有以下选项:
max_connections = 10000
key_buffer_size = 1024M
join_buffer_size = 256M
read_buffer_size = 256M
sort_buffer_size = 256M
tmp_table_size = 512M
read_rnd_buffer_size = 8M
max_heap_table_size = 512M
thread_cache_size = 8192
query_cache_type = 1
query_cache_size = 15G
wait_timeout = 6000
connect_timeout = 15
interactive_timeout = 60
max_allowed_packet = 512M
bulk_insert_buffer_size = 64M
innodb_log_file_size = 512M
innodb_log_buffer_size = 2G
innodb_buffer_pool_size = 20G
您能帮我解决死锁问题吗?我该如何解决?我应该在死锁中重新运行查询吗?
答案 0 :(得分:2)
TL; DR -在尝试为每个cl_id
生成新的递增ID时,无法进行并发插入。您必须使用表锁来执行此操作,从而导致并发插入按顺序运行。
AUTO_INCREMENT
绕过此死锁的原因是它获得了简短的表锁以生成下一个ID。从技术上讲,这会导致所有执行INSERT的并发会话按顺序执行。幸运的是,表锁非常简短。默认情况下,ID生成后立即将其释放。您可以在此处了解更多信息:https://dev.mysql.com/doc/refman/8.0/en/innodb-auto-increment-handling.html
您生成id的方法会导致死锁,因为它使用了两个锁定操作:
但是锁不是一起获得的,两步之间只有很短的时间,这就是竞争条件发生的地方。我们可以通过使用两个表来证明这一点:
mysql> create table foo ( id serial primary key);
mysql> insert into foo (id) values (1);
mysql> create table bar ( id serial primary key);
mysql> create trigger b before insert on bar
for each row set new.id=(select max(id) from foo);
现在我们在bar
上有一个触发器,该触发器将读取foo
中的某行以获取max(id)。
mysql> begin;
mysql> insert into bar () values ();
这应该使用从bar
读取的值在foo
中创建新行。但是交易仍在进行中。
在第二个窗口中,执行以下操作:
mysql> update foo set id = 2;
...
此挂起,等待foo
上的X锁定。它无法更新foo
,因为会话已在它的第一个窗口中放置了S锁。
返回第一个窗口并运行:
mysql> update foo set id = 3;
Query OK, 1 row affected (0.01 sec)
Rows matched: 1 Changed: 1 Warnings: 0
这将创建一个循环锁定等待,这就是死锁。两个事务都在等待另一个事务持有的锁。我们在第二个窗口中看到该交易被终止:
mysql> update foo set id = 2;
...
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction
“该如何解决?我应该在死锁中重新运行查询吗?”
一种解决方法是,在尝试插入之前,通过获取INSERT或触发器引用的所有表上的表锁,强制并发会话连续运行。
mysql> begin;
mysql> lock tables foo write, bar write;
mysql> insert into bar () values ();
第二个窗口挂起,但是它挂在一个表锁上,而不是行锁上。
mysql> update foo set id = 2;
...
在第一个窗口中,完成交易。解锁表锁将隐式提交事务。
mysql> unlock tables;
第二个窗口停止等待,并成功完成其更新。
mysql> update foo set id = 2;
...
Query OK, 1 row affected (3.50 sec)
Rows matched: 1 Changed: 1 Warnings: 0
请注意,它一直在等待3.5秒,这是我回到第一个窗口并提交交易所花的时间。
按顺序进行会话插入会限制应用程序的吞吐量,因为会话正在排队。但这避免了死锁。