Redian新闻
>
MySQL 底层之 MVCC、回滚段、一致性读、锁定读

MySQL 底层之 MVCC、回滚段、一致性读、锁定读

公众号新闻

点击上方“芋道源码”,选择“设为星标

管她前浪,还是后浪?

能浪的浪,才是好浪!

每天 10:33 更新文章,每天掉亿点点头发...

源码精品专栏

 
来源:www.toutiao.com/article/
6870511371512087047/

你是否对 MySQL 数据库中的事务已经有所了解?看下面这张图,按照 1~6 的顺序依次执行,在RR隔离级别下,事务 A 和事务 B 各自输出的 num 值是多少吗?

我们预先创建好这样一张表并初始化一条数据:

CREATE TABLE `test1`  (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键Id',
  `num` int(11) NULL COMMENT '数量',
  PRIMARY KEY (`id`)
) ENGINE 
= InnoDB;

insert into test1(id, num) values (11);

然后开始按上图的顺序执行各个事务,这需要我们打开3个操作窗口来分别执行 A、B、C 三个事务:

事务 A:

事务 B:

事务 C:

按照上图的执行顺序执行 commit,其中事务 C 是自动提交事务的,不需要我们显示的 commit,事务 A、B 的输出结果如下:

事务A:num=1

事务B:num=3

为什么是这样输出?

它的背后其实是:MVCC(多版本并发控制)、consistent read(一致性读)、locking reads(锁定读)等 MySQL 数据库底层知识。

1、MVCC

MySQL 数据库官网文档是这样来描述 MVCC 的:

官网链接:

https://dev.mysql.com/doc/refman/8.0/en/innodb-multi-versioning.html

淘宝的数据库内核月报中有提到(文末有文章链接):

多版本控制: 指的是一种提高并发的技术。最早的数据库系统,只有读读之间可以并发,读写,写读,写写都要阻塞。引入多版本之后,只有写写之间相互阻塞,其他三种操作都可以并行,这样大幅度提高了 InnoDB 的并发度。在内部实现中,与 Postgres 在数据行上实现多版本不同,InnoDB 是在 undolog 中实现的,通过 undolog 可以找回数据的历史版本。找回的数据历史版本可以提供给用户读(按照隔离级别的定义,有些读请求只能看到比较老的数据版本),也可以在回滚的时候覆盖数据页上的数据。在 InnoDB 内部中,会记录一个全局的活跃读写事务数组,其主要用来判断事务的可见性。

目前来看 MVCC 的实现依赖于:

  • 隐藏字段(DB_TRX_ID、DB_ROLL_PTR)
  • 回滚日志(undo log)
  • 一致性读(consistent read)

你也可以这样去理解 MVCC:一个事务对数据进行更新操作时候,先把旧的数据放到一个单独的地方(回滚段),其他事务读取数据时候,根据 DB_TRX_ID、DB_ROLL_PTR 计算出 undo log 链中当前版本的数据。

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/ruoyi-vue-pro
  • 视频教程:https://doc.iocoder.cn/video/

2、一致性读(consistent read)

继续看官方文档对 consistent read 的描述:

官网链接:

https://dev.mysql.com/doc/refman/8.0/en/glossary.html#glos_consistent_read

直译:

一个读操作使用基于某个时刻的快照信息来显示查询结果,而不考虑同时运行的其他事务所执行的更改。如果查询到的数据被其他事务所更改,则根据 undo log 中的内容来重建原始数据。这种技术避免了一些通过强制事务等待其他事务完成而降低并发性的锁定问题。

  1. 在 RR 级别下,首次读操作被执行时候创建一致性读视图 ReadView,事务的后续读都基于该视图的数据;
  2. 在 RC 级别下,每一次读操作都会创建一个最新的 ReadView,因此每次 select 读都可以获取到当前已提交事务的最新数据。

“一致性读”是 InnoDB 引擎在 RC 和 RR 隔离级别下处理 select 语句的默认模式。因为一个“一致性读”是不需要对它访问的表设置任何的锁,当对表执行“一致性读”时候,其他会话可以自由的修改这些表。

另外:

读未提交(read uncommitted)、串行化(serializable)是不需要依赖 MVCC 的,读未提交直接每次都读取当前数据的最新值即可。而 serializable 是直接采用加锁的操作让所有的事务都串行化执行,牺牲了并发能力。

一致性读的实现方式:

  1. 每个事务启动的瞬间,都会构建一个数组(m_ids),用来记录目前所有“活跃事务”(事务启动了,但是还没提交)的 ID;
  2. 数组中的最小事务 ID 为低水位;
  3. 数组中的最大事务 ID + 1 为高水位;
  4. 数据版本可见性规则:当前数据某个版本是否可见,取决于当前数据的 DB_TRX_ID 以及这个一致性视图数组中记录的事务 ID 做对比来判断:低水位以前的数据版本可见,高水位以后的数据版本不可见,低水位和高水位之间得查看当前数据版本的 DB_TRX_ID 是否存在数组中,若存在意味着事务未提交,不可见,若不存在意味着事务已提交,可见。

那按照一致性读的理解,事务B已经创建了自己的快照数据了,它的输出应该是 num = 2 呀,为什么会是 num=3?

可是如果不是 num=3,那么已经提交的事务 C 的操作不就丢失了吗?(产生丢失更新问题)

这里又涉及到一个知识点:

更新数据都是先读后写的,而这个读,只能读当前的值,称为“当前读”(current read)。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/yudao-cloud
  • 视频教程:https://doc.iocoder.cn/video/

3、当前读(current reads)

也叫做锁定读(locking reads)

官方文档:

https://dev.mysql.com/doc/refman/5.7/en/innodb-locking-reads.html

InnoDB 引擎支持两种方式的锁定读以提供额外的安全性(MySQL 5.7 版本):

# 读锁(S 锁,共享锁)
SELECT ... LOCK IN SHARE MODE;
# 写锁(X 锁,排他锁)
SELECT ... FOR UPDATE;

锁定读会在被读取的数据上加一把共享锁,其他事务可以读取记录,但是不可以修改记录,直到当前事务提交。

锁定读验证:

为什么要有锁定读?

如果你在一个事务中先查询了一个数据,然后插入或者更新相关的数据,这个时候来了一个事务B同时更新或者删除你要查询的记录,就会出现幻读问题了。

这也是为什么 MVCC 不能完全解决幻读的问题,而是需要 MVCC + 行锁 + 间隙锁(next-key lock)的方式。

4、事务 A、B、C 的执行流程

继续看开头的第一张图:

start transaction with consistent snapshot;

这条 SQL 语句可以立即启动事务,创建当前事务的一致性读快照。效果等同于 start transaction 然后马上执行 select 语句。

我们接下来看看文章开头的三个事务对数据行的修改流程,按照步骤 1~6 的操作如下:

如果大家细致的查看上图的三个事务的穿插执行流程,可以发现,A、B、C 三个事务无论是 commit 还是 rollback,都是可以最终得到正确的数据。

这就是 InnoDB 引擎下的多版本并发控制(MVCC)的实现原理。

总结以下几个关键点:

  1. 每一个事务都会创建一个数据快照,快照创建的时机根据隔离级别的不同有所区别;
  2. 每一个事务都会生成一个全局唯一的 DB_TRX_ID,用于标记当前版本;
  3. DB_ROLL_PTR 是回滚指针的意思,结合 DB_TRX_ID 来最终确定我要拿到的数据;
  4. DB_TRX_ID、DB_ROLL_PTR、undo log 这三个值来控制数据的版本;
  5. update、delete 操作都是先读后写,这个读属于锁定读(当前读)。

5、巨人的肩膀

  • 《MySQL实战45讲》
  • 《高性能MySQL 第二版》
  • MySQL官网:https://dev.mysql.com/doc/refman/8.0/en/innodb-multi-versioning.html
  • 淘宝数据库内核月报 - 2017 / 12:http://mysql.taobao.org/monthly/2017/12/01/


欢迎加入我的知识星球,一起探讨架构,交流源码。加入方式,长按下方二维码噢

已在知识星球更新源码解析如下:

最近更新《芋道 SpringBoot 2.X 入门》系列,已经 101 余篇,覆盖了 MyBatis、Redis、MongoDB、ES、分库分表、读写分离、SpringMVC、Webflux、权限、WebSocket、Dubbo、RabbitMQ、RocketMQ、Kafka、性能测试等等内容。

提供近 3W 行代码的 SpringBoot 示例,以及超 4W 行代码的电商微服务项目。

获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。

文章有帮助的话,在看,转发吧。

谢谢支持哟 (*^__^*)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一文掌握 MyBatis 的动态 SQL 使用与原理MariaDB 成功上市!MySQL 之父 YYDS!!惊心动魄世界杯-荷阿大赛峰回路转隐语开源首个工业级多方安全数据分析系统SCQL:像写SQL一样「易用」隐私计算MySQL索引15连问,抗住!SpringBoot + Druid,完美监控 MySQL 性能美团:MySQL 自增主键一定是连续的吗?千万热搜“第一次吃华莱士”,揭露残酷底层之痛…MySQL 常用脚本美国入境档案--黎莉莉罗静予13 款炫酷的 MySQL 可视化管理工具!MySQL客户端的进阶操作MySQL 5.7 并行复制实现原理与调优MySQL性能优化浅析及线上案例了解那些“奇葩”SQL写法,快速写出高效率SQL广州地铁总经理刘智成:5号线东延段、7号线二期今年开通,8号线东延段、佛穗莞城际今年开工MySQL 最朴素的监控方式!用完爱不释手5大主流方案对比:MySQL千亿级数据线上平滑扩容实战美团四面:如何保障 MySQL 和 Redis 的数据一致性?MySQL 批量操作,一次插入多少行数据效率最高?美团:为什么 MySQL 不推荐使用 join?面试官:MySQL中的 distinct 和 group by 哪个效率更高?退休 17- 聚餐刘家(3)MySQL索引下推知识分享如何高效实现MySQL与elasticsearch的数据同步SpringBoot 实现 MySQL 百万级数据量导出并避免 OOM 的解决方案癌症治疗的效果竟取决于生物钟SQLAlchemy 2.0.0发布首个RC,Python ORM框架出去兜一圈省了100块小钱。。MySQL适合运行在Docker中吗?SQL能完成哪方面的计算?一文详解关系代数和SQL语法MySQL 数据同步到 Redis 缓存, so Easy !MySQL 索引 15 连问,抗住!问了几人,MySQL changebuffer 这点都没答对MySQL 字符串指南 | Linux 中国
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。