我创建了一个服务应用程序,它使用多线程来并行处理位于InnoDB表中的数据(大约2-3百万条记录,并且不再需要由应用程序执行与InnoDB相关的查询)。每个线程对提到的表进行以下查询:
来自forum.percona.com的人给了我一条建议 - 不要使用SELECT FOR UPDATE和UPDATE,因为执行事务需要更长的时间(2个查询),并且等待导致的锁定超时。他们的建议是(自动提交):
它本来应该提高性能。然而,相反,我得到了更多的死锁并等待锁定超时比以前......
我读了很多关于优化InnoDB的信息,并且相应地调整了服务器,所以我的InnoDB设置是99%。第一种方案工作正常,比第二方案更好,也证明了这一事实。 my.cnf文件:
innodb_buffer_pool_size = 512M
innodb_thread_concurrency = 16
innodb_thread_sleep_delay = 0
innodb_log_buffer_size = 4M
innodb_flush_log_at_trx_commit=2
为什么优化没有成功的任何想法?
答案 0 :(得分:2)
我从您的流程描述中了解到:
如果是这种情况,那么你做的是正确的事情,因为这将比你提到的第二种方法具有更少的锁定。
您可以通过删除delete语句来进一步减少锁争用,因为这将锁定整个表。而不是这样做添加一个标志(名为processed的新列)并更新它。并在完成所有线程处理后删除末尾的行。
您还可以通过批量工作负载使工作分配变得智能化 - 在您的情况下,每个线程将要处理的行范围(可能使用PK) - 在这种情况下,您可以进行简单的选择而不需要FOR UPDATE子句,它将快速工作。