我的网络应用最多可以运行以下查询1-2次/秒,具体取决于用户流量:
UPDATE `click_rollups`
SET `clicks` = `clicks` + 1, `last_updated` = ?
WHERE `camp_id` = ?
AND `country` = ?
AND `clicks` < ?
AND `time_created` = ?
我们的日志显示有时会出现此错误:
SQLSTATE[40001]: Serialization failure: 1213 Deadlock found when trying to get lock; try restarting transaction
但是,click_rollups
仅在此事务的写入上下文中使用一次,因此我无法想象可能发生死锁的方式。仅使用SELECT
在应用程序的其他位置查询一次。
这是否意味着来自这两个单独事务(更新和仅选择)的死锁导致问题,因为每个单独的事务仅使用此表一次(并且使用此表的查询不引用任何其他表)?或者是否存在行级锁定问题,这可能意味着其中一个事务可能会因同一事务的其他事件而陷入僵局?
答案 0 :(得分:4)
在做了一些阅读之后,我发现,由于InnoDB确实使用行级锁定,因此只需插入或更新单行就会发生死锁,因为操作不是原子的。我跑了:
SHOW ENGINE INNODB STATUS
查找有关上次死锁的信息。我找到了:
------------------------
LATEST DETECTED DEADLOCK
------------------------
140106 17:22:41
*** (1) TRANSACTION:
TRANSACTION 63EB5222A, ACTIVE 0 sec starting index read
mysql tables in use 3, locked 3
LOCK WAIT 9 lock struct(s), heap size 3112, 6 row lock(s), undo log entries 2
MySQL thread id 4304350, OS thread handle 0x7fd3b74d3700, query id 173460207 192.168.0.2 sharecash Updating
UPDATE `click_rollups` SET `clicks` = `clicks` + 1, `last_updated` = '1389046961' WHERE `camp_id` = '27739' AND `country` = 'US' AND `clicks` < '1000' AND `time_created` = '1389046866'
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 186 page no 407 n bits 1272 index `country` of table `sharecash`.`click_rollups` trx id 63EB5222A lock_mode X waiting
*** (2) TRANSACTION:
TRANSACTION 63EB52225, ACTIVE 0 sec fetching rows
mysql tables in use 3, locked 3
177 lock struct(s), heap size 31160, 17786 row lock(s), undo log entries 2
MySQL thread id 4304349, OS thread handle 0x7fd6961c8700, query id 173460194 192.168.0.1 sharecash Updating
UPDATE `click_rollups` SET `clicks` = `clicks` + 1, `last_updated` = '1389046961' WHERE `camp_id` = '30949' AND `country` = 'US' AND `clicks` < '1000' AND `time_created` = '1388964767'
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 186 page no 407 n bits 1272 index `country` of table `sharecash`.`click_rollups` trx id 63EB52225 lock_mode X
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 186 page no 512 n bits 384 index `PRIMARY` of table `sharecash`.`click_rollups` trx id 63EB52225 lock_mode X locks rec but not gap waiting
*** WE ROLL BACK TRANSACTION (1)
您可以看到导致死锁的两个查询实际上是完全相同的。它表明WHERE子句中的列也有不同的参数,因此被锁定的实际行是不同的,这对我来说似乎有点反直觉 - 不同行集上的操作如何导致死锁? / p>
答案似乎是死锁是由索引结构中的查询引擎锁定条目引起的。如果查看上面的输出,可以看到一个事务对country
索引中某个页面的某个部分有锁定,并且需要锁定部分主键索引,而另一个事务是基本上是相反的情况。
我们的应用程序的这一部分中的一个不变量,只有一行的点击次数少于1000次,所以我相信通过修复该问题可以最大限度地减少死锁问题,因为总体上锁定会减少。 MySQL文档建议对应用程序进行编码,以便在由于死锁而导致回滚的情况下重新发出事务,这可以防止导致页面出错的问题。但是,如果有人对如何真正避免这些死锁有任何其他想法,请再次在评论中发布!
编辑 -
交易不需要使用country
索引,因为每个camp_id
值只有少数(通常只有1个)不同的country
值,每个这只相当于一排。我已经在查询中添加了一个索引提示,使其停止使用此索引,现在修复了该问题而没有任何性能损失(可能是一个很小的收益)。