首页 > 数据库> 文章详细

进阶 | MySQL 死锁案例解析一则

2022-09-15 22:03:36 阅读：243 来源： 互联网

标签：加锁进阶索引死锁 MySQL 主键 name

记一次MySQL 死锁分析处理过程，聊聊我的思路。前车之鉴，后事之师。

以一个例子为切入点

一、问题背景

某业务模块反馈数据库最近出现过几次死锁告警的情况，本文总结了这次死锁排查的全过程，并分析了导致死锁的原因及解决方案。

希望给大家提供一个死锁的排查及解决思路。

基础环境：

主机类型：x3850 X6
操作系统：DB:CentOS Linux release 7.4.1708、APP:CentOS Linux release 7.2.1511 (Core)
存储：IBM存储，2TB,MULTIPATH
内存：64 G
CPU型号：E7-4830 v3 @ 2.10GHz ( 4 U * 12 core)
CPU核数：32CORE
数据库环境：5.7.27
事务隔离级别：READ-COMMITED

问题现象：MySQL 死锁告警

告警日志：

二、分析说明

通过分析日志定位、分析死锁原因；
追溯历史数据，分析关键指标的历史波动,这些关键指标可以用来做为数据库健康度参考指标。
用实际数据来验证推断，排除掉其它干扰因素，定位数据库问题的根本原因，帮助快速修复。

三、MySQL加锁机制

在深入探究问题之前，我们先了解一下 MySQL 的加锁机制。

首先要明确的一点是 MySQL 加锁实际上是给索引加锁，而非给数据加锁。我们先看下MySQL 索引的结构。

MySQL 索引分为主键索引(或聚簇索引)和二级索引(或非主键索引、非聚簇索引、辅助索引，包括各种主键索引外的其他所有索引)。不同存储引擎对于数据的组织方式略有不同

对InnoDB而言，主键索引和数据是存放在一起的，构成一颗B+树(称为索引组织表)，主键位于非叶子节点，数据存放于叶子节点。

示意图如下：

而MyISAM是堆组织表，主键索引和数据分开存放，叶子节点保存的只是数据的物理地址，示意图如下：

二级索引的组织方式对于InnoDB和MyISAM是一样的，保存了二级索引和主键索引的对应关系，二级索引列位于非叶子节点，主键值位于叶子节点，示意图如下：

那么在MySQL 的这种索引结构下，我们怎么找到需要的数据呢？

以select * from t where name='aaa'为例，MySQL Server对sql进行解析后发现name字段有索引可用，于是先在二级索引(图2-2)上根据name='aaa'找到主键id=17，然后根据主键17到主键索引上(图2-1)上找到需要的记录。

了解 MySQL 利用索引对数据进行组织和检索的原理后，接下来看下MySQL 如何给索引枷锁。

需要了解的是索引如何加锁和索引类型(主键、唯一、非唯一、没有索引)以及隔离级别(RC、RR等)有关。本例中限定隔离级别为RC，RR情况下和RC加锁基本一致，不同的是RC为了防止幻读会额外加上间隙锁。

2.1 根据主键进行更新

update t set name='xxx' where id=29；只需要将主键上id=29的记录加上X锁即可(X锁称为互斥锁，加锁后本事务可以读和写，其他事务读和写会被阻塞)。如下：

2.2 根据唯一索引进行更新

update t set name='xxx' where name='ddd';这里假设name是唯一的。InnoDB现在name索引上找到name='ddd'的索引项(id=29)并加上加上X锁，然后根据id=29再到主键索引上找到对应的叶子节点并加上X锁。

一共两把锁，一把加在唯一索引上，一把加在主键索引上。这里需要说明的是加锁是一步步加的，不会同时给唯一索引和主键索引加锁。这种分步加锁的机制实际上也是导致死锁的诱因之一。示意如下：

2.3 根据非唯一索引进行更新

update t set name='xxx' where name='ddd';这里假设name不唯一，即根据name可以查到多条记录(id不同)。和上面唯一索引加锁类似，不同的是会给所有符合条件的索引项加锁。示意如下：

这里一共四把锁，加锁步骤如下：

1、在非唯一索引(name)上找到(ddd,29)的索引项，加上X锁；

2、根据(ddd,29)找到主键索引的(29,ddd)记录，加X锁；

3、在非唯一索引(name)上找到(ddd,37)的索引项，加上X锁；

4、根据(ddd,29)找到主键索引的(37,ddd)记录，加X锁；

从上面步骤可以看出，InnoDB对于每个符合条件的记录是分步加锁的，即先加二级索引再加主键索引；其次是按记录逐条加锁的，即加完一条记录后，再加另外一条记录，直到所有符合条件的记录都加完锁。那么锁什么时候释放呢？答案是事务结束时会释放所有的锁。

小结：MySQL 加锁和索引类型有关，加锁是按记录逐条加，另外加锁也和隔离级别有关。

四、疑问点排查及分析思路

1、发生死锁的表结构及索引情况(隐去了部分无关字段和索引)：

如下：

该表共有三个索引，1个主键索引，2个普通索引。

2、分析死锁日志

发生死锁，第一时间查看死锁日志，内容如下：

分析下死锁日志，可以得到以下信息：

导致死锁的两条SQL语句。
事务1，持有索引idx_seller_transNo的锁，在等待获取PRIMARY的锁。
事务2，持有PRIMARY的锁，在等待获取idx_seller_transNo的锁。
因事务1和事务2之间发生循环等待，故发生死锁。
事务1和事务2当前持有的锁均为：lock_mode X locks rec but not gap

两个事务对记录加的都是X 锁，No Gap锁，即对当行记录加锁(Record Lock)，并未加间隙锁。

3、常见锁类型

X锁：排他锁、又称写锁。若事务T对数据对象A加上X锁，事务T可以读A也可以修改A，其他事务不能再对A加任何锁，直到T释放A上的锁。这保证了其他事务在T释放A上的锁之前不能再读取和修改A。

与之对应的是S锁：共享锁，又称读锁，若事务T对数据对象A加上S锁，则事务T可以读A但不能修改A，其他事务只能再对A加S锁，而不能加X锁，直到T释放A上的S锁。这保证了其他事务可以读A，但在T释放A上的S锁之前不能对A做任何修改。

Gap Lock：间隙锁，锁定一个范围，但不包括记录本身。GAP锁的目的，是为了防止同一事务的两次当前读，出现幻读的情况。

Next-Key Lock：1+2，锁定一个范围，并且锁定记录本身。对于行的查询，都是采用该方法，主要目的是解决幻读的问题。

根据目前掌握的信息，可以做一些简单的推断。

首先，此次死锁一定是和Gap锁以及Next-Key Lock没有关系的。因为数据库隔离级别是RC(READ-COMMITED)的，这种隔离级别是不会添加Gap锁的。前面的死锁日志也提到这一点。

然后，就要翻代码了，看看代码中事务到底是怎么做的。核心代码及SQL如下：

该代码的目的是先后修改同一条记录的两个不同字段，同一个事务中执行了两条Update语句，再分别查看下两条SQL的执行计划：分别用到了PRIMARY索引和idx_seller_transNo索引。

有了以上这些已知信息，就可以开始排查死锁原因及其背后的原理了。

通过分析死锁日志，再结合代码以及建表语句，发现主要问题出在idx_seller_transNo索引上面：

索引创建语句中，使用了前缀索引，为了节约索引空间，提高索引效率，只选择了fund_transfer_order_no字段的前20位作为索引值。

因为fund_transfer_order_no只是普通索引，而非唯一性索引。又因为在一种特殊情况下，会有同一个用户的两个fund_transfer_order_no的前20位相同，这就导致两条不同的记录的索引值一样(因为seller_id 和fund_transfer_order_no(20)都相同 )。

那么为什么fund_transfer_order_no的前20位相同会导致死锁呢?

我们知道，在MySQL中，行级锁并不是直接锁记录，而是锁索引。索引分为主键索引和非主键索引两种，如果一条sql语句操作了主键索引，MySQL就会锁定这条主键索引;如果一条语句操作了非主键索引，MySQL会先锁定该非主键索引，再锁定相关的主键索引。

主键索引的叶子节点存的是整行数据。在InnoDB中，主键索引也被称为聚簇索引(clustered index)。
非主键索引的叶子节点的内容是主键的值，在InnoDB中，非主键索引也被称为非聚簇索引(secondary index)。

死锁的发生与否，并不在于事务中有多少条SQL语句，死锁的关键在于：两个(或以上)的Session加锁的顺序不一致。

事务在以非主键索引为where条件进行Update的时候，会先对该非主键索引加锁，然后再查询该非主键索引对应的主键索引都有哪些，再对这些主键索引进行加锁。

五、解决方案解决方案至此，我们分析清楚了导致死锁的根本原理以及其背后的原理。那么这个问题解决起来就不难了。

可以从两方面入手，分别是修改索引和修改代码(包含SQL语句)。

修改索引：只要我们把前缀索引 idx_seller_transNo中fund_transfer_order_no的前缀长度修改下就可以了。比如改成50。即可避免死锁。

但是，改了idx_seller_transNo的前缀长度后，可以解决死锁的前提条件是update语句真正执行的时候，会用到fund_transfer_order_no索引。如果MySQL查询优化器在代价分析之后，决定使用索引 KEY idx_seller(seller_id)，那么还是会存在死锁问题。原理和本文类似。

所以，根本解决办法就是改代码：

所有update都通过主键ID进行。
在同一个事务中，避免出现多条update语句修改同一条记录。

其他思考

在死锁发生之后的一周内，前前后后做过很多中种推断及假设，最终还是要靠实践来验证自己的想法。遇到问题，不要想当然，亲手复现下问题，然后再来分析。

通过本文，大家可以掌握死锁分析的基本理论和一般方法，希望能为大家工作中快速解决实际出现的死锁问题提供思路。

更多精彩内容，关注我们▼▼

标签：加锁,进阶,索引,死锁,MySQL,主键,name
来源： https://www.cnblogs.com/shujuyr/p/16698074.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

进阶 | MySQL 死锁案例解析一则