You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

676 lines
36 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

## 1.4.事务和事务的隔离级别
### 1.4.1.为什么需要事务
事务是数据库管理系统DBMS执行过程中的一个逻辑单位不可再进行分割由一个有限的数据库操作序列构成多个DML语句select语句不包含事务要不全部成功要不全部不成功。
A 给B 要划钱A 的账户-1000元 B 的账户就要+1000元这两个update 语句必须作为一个整体来执行不然A 扣钱了B 没有加钱这种情况就是错误的。那么事务就可以保证A 、B 账户的变动要么全部一起发生,要么全部一起不发生。
### 1.4.2.事务特性
事务应该具有4个属性原子性、一致性、隔离性、持久性。这四个属性通常称为ACID特性。
**l 原子性atomicity**
**l 一致性consistency**
**l 隔离性isolation**
**l 持久性durability**
#### 1.4.2.1.原子性atomicity
一个事务必须被视为一个不可分割的最小单元,整个事务中的所有操作要么全部提交成功,要么全部失败,对于一个事务来说,不能只执行其中的一部分操作。比如:
连老师借给李老师1000元
1.连老师工资卡扣除1000元
2.李老师工资卡增加1000元
整个事务的操作要么全部成功,要么全部失败,不能出现连老师工资卡扣除,但是李老师工资卡不增加的情况。如果原子性不能保证,就会很自然的出现一致性问题。
#### 1.4.2.2.一致性consistency
一致性是指事务将数据库从一种一致性转换到另外一种一致性状态,在事务开始之前和事务结束之后数据库中数据的完整性没有被破坏。
连老师借给李老师1000元
1.连老师工资卡扣除1000元
2.李老师工资卡增加1000元
扣除的钱(-500 与增加的钱500 相加应该为0或者说连老师和李老师的账户的钱加起来前后应该不变。
#### 1.4.2.3.持久性durability
一旦事务提交,则其所做的修改就会永久保存到数据库中。此时即使系统崩溃,已经提交的修改数据也不会丢失。
#### 1.4.2.4.隔离性isolation
一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
如果隔离性不能保证,会导致什么问题?
连老师借给李老师生活费借了两次每次都是1000连老师的卡里开始有10000李老师的卡里开始有500从理论上借完后连老师的卡里有8000李老师的卡里应该有2500。
我们将连老师向李老师同时进行的两次转账操作分别称为T1和T2在现实世界中T1和T2是应该没有关系的可以先执行完T1再执行T2或者先执行完T2再执行T1结果都是一样的。但是很不幸真实的数据库中T1和T2的操作可能交替执行的执行顺序就有可能是
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/db81c54724b54e749ec5dd801f29e91b.png)
如果按照上图中的执行顺序来进行两次转账的话最终我们看到连老师的账户里还剩9000元钱相当于只扣了1000元钱但是李老师的账户里却成了2500元钱多了10000元这银行岂不是要亏死了
所以对于现实世界中状态转换对应的某些数据库操作来说,不仅要保证这些操作以原子性的方式执行完成,而且要保证其它的状态转换不会影响到本次状态转换,这个规则被称之为隔离性。
### 1.4.3.事务并发引发的问题
我们知道MySQL是一个客户端服务器架构的软件对于同一个服务器来说可以有若干个客户端与之连接每个客户端与服务器连接上之后就可以称之为一个会话Session。每个客户端都可以在自己的会话中向服务器发出请求语句一个请求语句可能是某个事务的一部分也就是对于服务器来说可能同时处理多个事务。
在上面我们说过事务有一个称之为隔离性的特性,理论上在某个事务对某个数据进行访问时,其他事务应该进行排队,当该事务提交之后,其他事务才可以继续访问这个数据,这样的话并发事务的执行就变成了串行化执行。
但是对串行化执行性能影响太大,我们既想保持事务的一定的隔离性,又想让服务器在处理访问同一数据的多个事务时性能尽量高些,当我们舍弃隔离性的时候,可能会带来什么样的数据问题呢?
#### 1.4.3.1.脏读
当一个事务读取到了另外一个事务修改但未提交的数据,被称为脏读。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/05e67865973a410e93190c52a74be697.png)
1、在事务A执⾏过程中事务A对数据资源进⾏了修改事务B读取了事务A修改后的数据。
2、由于某些原因事务A并没有完成提交发⽣了RollBack操作则事务B读取的数据就是脏数据。
这种读取到另⼀个事务未提交的数据的现象就是脏读(Dirty Read)。
#### 1.4.3.2.不可重复读
当事务内相同的记录被检索两次,且两次得到的结果不同时,此现象称为不可重复读。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/3895ad68683747e88b114bba40f48ad9.png)
事务B读取了两次数据资源在这两次读取的过程中事务A修改了数据导致事务B在这两次读取出来的
数据不⼀致。
#### 1.4.3.3.幻读
在事务执行过程中,另一个事务将新记录添加到正在读取的事务中时,会发生幻读。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/3a92feb9aa014a7eaaf784d1c7057822.png)
事务B前后两次读取同⼀个范围的数据在事务B两次读取的过程中事务A新增了数据导致事务B后⼀
次读取到前⼀次查询没有看到的⾏。
幻读和不可重复读有些类似,但是幻读重点强调了读取到了之前读取没有获取到的记录。
### 1.1.4.SQL标准中的四种隔离级别
我们上边介绍了几种并发事务执行过程中可能遇到的一些问题,这些问题也有轻重缓急之分,我们给这些问题按照严重性来排一下序:
脏读 > 不可重复读 > 幻读
我们上边所说的舍弃一部分隔离性来换取一部分性能在这里就体现在设立一些隔离级别隔离级别越低越严重的问题就越可能发生。有一帮人并不是设计MySQL的大叔们制定了一个所谓的SQL标准在标准中设立了4个隔离级别
**READ UNCOMMITTED未提交读。**
**READ COMMITTED已提交读。**
**REPEATABLE READ可重复读。**
**SERIALIZABLE可串行化。**
SQL标准中规定针对不同的隔离级别并发事务可以发生不同严重程度的问题具体情况如下
也就是说:
**READ UNCOMMITTED隔离级别下可能发生脏读、不可重复读和幻读问题。**
**READ COMMITTED隔离级别下可能发生不可重复读和幻读问题但是不可以发生脏读问题。**
**REPEATABLE READ隔离级别下可能发生幻读问题但是不可以发生脏读和不可重复读的问题。**
**SERIALIZABLE隔离级别下各种问题都不可以发生。**
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/21048532674b4486a21b90258b046a15.png)
### 1.4.5.MySQL中的隔离级别
不同的数据库厂商对SQL标准中规定的四种隔离级别支持不一样比方说Oracle就只支持READ COMMITTED和SERIALIZABLE隔离级别。本书中所讨论的MySQL虽然支持4种隔离级别但与SQL标准中所规定的各级隔离级别允许发生的问题却有些出入MySQL在REPEATABLE READ隔离级别下是可以禁止幻读问题的发生的。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/1452d922eb0f4dda803126784436e8b2.png)
MySQL的默认隔离级别为REPEATABLE READ我们可以手动修改事务的隔离级别。
#### 1.4.5.1.如何设置事务的隔离级别
我们可以通过下边的语句修改事务的隔离级别:
SET [GLOBAL|SESSION] TRANSACTION ISOLATION LEVEL level;
其中的level可选值有4个
```
level: {
REPEATABLE READ
| READ COMMITTED
| READ UNCOMMITTED
| SERIALIZABLE
}
```
设置事务的隔离级别的语句中在SET关键字后可以放置GLOBAL关键字、SESSION关键字或者什么都不放这样会对不同范围的事务产生不同的影响具体如下
**使用GLOBAL关键字在全局范围影响**
比方说这样:
```
SET GLOBAL TRANSACTION ISOLATION LEVEL SERIALIZABLE;
```
则: 只对执行完该语句之后产生的会话起作用。当前已经存在的会话无效。
**使用SESSION关键字在会话范围影响**
比方说这样:
```
SET SESSION TRANSACTION ISOLATION LEVEL SERIALIZABLE;
```
则:对当前会话的所有后续的事务有效
该语句可以在已经开启的事务中间执行,但不会影响当前正在执行的事务。
如果在事务之间执行,则对后续的事务有效。
**上述两个关键字都不用(只对执行语句后的下一个事务产生影响):**
比方说这样:
```
SET TRANSACTION ISOLATION LEVEL SERIALIZABLE;
```
则:只对当前会话中下一个即将开启的事务有效。下一个事务执行完后,后续事务将恢复到之前的隔离级别。该语句不能在已经开启的事务中间执行,会报错的。
如果我们在服务器启动时想改变事务的默认隔离级别可以修改启动参数transaction-isolation的值比方说我们在启动服务器时指定了--transaction-isolation=SERIALIZABLE那么事务的默认隔离级别就从原来的REPEATABLE READ变成了SERIALIZABLE。
想要查看当前会话默认的隔离级别可以通过查看系统变量transaction_isolation的值来确定
```
SHOW VARIABLES LIKE 'transaction_isolation';
```
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/a863d53bff964d74a21b52de56bc97df.png)
或者使用更简便的写法:
```
SELECT @@transaction_isolation;
```
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/390b1f7f9b7947ee97716cdc08d3848a.png)
注意transaction_isolation是在MySQL 5.7.20的版本中引入来替换tx_isolation的如果你使用的是之前版本的MySQL请将上述用到系统变量transaction_isolation的地方替换为tx_isolation。
### 1.4.6.MySQL事务
#### 1.4.6.1.事务基本语法
**事务开始**
1、begin
2、START TRANSACTION推荐
3、begin work
**事务回滚**
rollback
**事务提交**
commit
使用事务插入两行数据commit后数据还在
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/874c5a5d37c44347827edc01c7646d58.png)
使用事务插入两行数据rollback后数据没有了
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/80e27d57435b4034a20c3ea4566c7674.png)
#### 1.4.6.2.保存点
如果你开启了一个事务执行了很多语句忽然发现某条语句有点问题你只好使用ROLLBACK语句来让数据库状态恢复到事务执行之前的样子然后一切从头再来但是可能根据业务和数据的变化不需要全部回滚。所以MySQL里提出了一个保存点英文savepoint的概念就是在事务对应的数据库语句中打几个点我们在调用ROLLBACK语句时可以指定会滚到哪个点而不是回到最初的原点。定义保存点的语法如下
SAVEPOINT 保存点名称;
当我们想回滚到某个保存点时可以使用下边这个语句下边语句中的单词WORK和SAVEPOINT是可有可无的
```
ROLLBACK TO [SAVEPOINT] 保存点名称;
```
不过如果ROLLBACK语句后边不跟随保存点名称的话会直接回滚到事务执行之前的状态。
如果我们想删除某个保存点,可以使用这个语句:
```
RELEASE SAVEPOINT 保存点名称;
```
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/3dd600ff2c384d5f8e348c8bc33a6c76.png)
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/2e56bef3f9954c3f943168d546ae662f.png)
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/dbca0f38164045eda2543112de99d69b.png)
#### 1.4.6.3.隐式提交
当我们使用START TRANSACTION或者BEGIN语句开启了一个事务或者把系统变量autocommit的值设置为OFF时事务就不会进行自动提交但是如果我们输入了某些语句之后就会悄悄的提交掉就像我们输入了COMMIT语句了一样这种因为某些特殊的语句而导致事务提交的情况称为隐式提交这些会导致事务隐式提交的语句包括
##### 1.4.6.3.1.执行DDL
定义或修改数据库对象的数据定义语言Datadefinition language缩写为DDL
所谓的数据库对象指的就是数据库、表、视图、存储过程等等这些东西。当我们使用CREATE、ALTER、DROP等语句去修改这些所谓的数据库对象时就会隐式的提交前边语句所属于的事务就像这样
```
BEGIN;
SELECT ... # 事务中的一条语句
UPDATE ... # 事务中的一条语句
... # 事务中的其它语句
CREATE TABLE ...
```
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/34acaa6366574b638f74d96d65f76274.png)
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/9a70501b6a0645f389deae88494426fa.png)
**此语句会隐式的提交前边语句所属于的事务**
##### 1.4.6.3.2.隐式使用或修改mysql数据库中的表
当我们使用ALTER USER、CREATE USER、DROP USER、GRANT、RENAME USER、REVOKE、SET PASSWORD等语句时也会隐式的提交前边语句所属于的事务。
##### 1.4.6.3.3.事务控制或关于锁定的语句
当我们在一个会话里一个事务还没提交或者回滚时就又使用START TRANSACTION或者BEGIN语句开启了另一个事务时会隐式的提交上一个事务比如这样
```
BEGIN;
SELECT ... # 事务中的一条语句
UPDATE ... # 事务中的一条语句
... # 事务中的其它语句
BEGIN; # 此语句会隐式的提交前边语句所属于的事务
```
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/6aaf9a1f630c4210996782d1c6fa6a97.png)
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/93a9ef0063704f31b47838b257fb6cf0.png)
或者当前的autocommit系统变量的值为OFF我们手动把它调为ON时也会隐式的提交前边语句所属的事务。
或者使用LOCK TABLES、UNLOCK TABLES等关于锁定的语句也会隐式的提交前边语句所属的事务。
##### 1.4.6.3.4.加载数据的语句
比如我们使用LOAD DATA语句来批量往数据库中导入数据时也会隐式的提交前边语句所属的事务。
##### 1.4.6.3.5.关于MySQL复制的一些语句
使用START SLAVE、STOP SLAVE、RESET SLAVE、CHANGE MASTER TO等语句时也会隐式的提交前边语句所属的事务。
##### 1.4.6.3.6.其它的一些语句
使用ANALYZE TABLE、CACHE INDEX、CHECK TABLE、FLUSH、 LOAD INDEX INTO CACHE、OPTIMIZE TABLE、REPAIR TABLE、RESET等语句也会隐式的提交前边语句所属的事务。
## 1.5. MVCC
全称Multi-Version Concurrency Control即多版本并发控制主要是为了提高数据库的并发性能。
同一行数据平时发生读写请求时会上锁阻塞住。但MVCC用更好的方式去处理读—写请求做到在发生读—写请求冲突时不用加锁。
这个读是指的快照读,而不是当前读,当前读是一种加锁操作,是悲观锁。
那它到底是怎么做到读—写不用加锁的,快照读和当前读是指什么?我们后面都会学到。
### 1.5.1.MVCC原理
#### 1.5.1.1.复习事务隔离级别![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/6a7f761e85854fc0a252a476f20f8235.png)
MySQL在REPEATABLE READ隔离级别下是可以很大程度避免幻读问题的发生的**好像解决了,但是又没完全解决**MySQL是怎么做到的
#### 1.5.1.2.版本链
**必须要知道的概念(每个版本链针对的一条数据):**
我们知道对于使用InnoDB存储引擎的表来说它的聚簇索引记录中都包含两个必要的隐藏列row_id并不是必要的我们创建的表中有主键或者非NULL的UNIQUE键时都不会包含row_id列
trx_id每次一个事务对某条聚簇索引记录进行改动时都会把该事务的事务id赋值给trx_id隐藏列。
roll_pointer每次对某条聚簇索引记录进行改动时都会把旧的版本写入到undo日志中然后这个隐藏列就相当于一个指针可以通过它来找到该记录修改前的信息。
补充点undo日志为了实现事务的原子性InnoDB存储引擎在实际进行增、删、改一条记录时都需要先把对应的undo日志记下来。**一般每对一条记录做一次改动就对应着一条undo日志**但在某些更新记录的操作中也可能会对应着2条undo日志。一个事务在执行过程中可能新增、删除、更新若干条记录也就是说需要记录很多条对应的undo日志这些undo日志会被从0开始编号也就是说根据生成的顺序分别被称为第0号undo日志、第1号undo日志、...、第n号undo日志等这个编号也被称之为undo no。
为了说明这个问题,我们创建一个演示表
```
CREATE TABLE teacher (
number INT,
name VARCHAR(100),
domain varchar(100),
PRIMARY KEY (number)
) Engine=InnoDB CHARSET=utf8;
```
然后向这个表里插入一条数据:
```
INSERT INTO teacher VALUES(1, '李瑾', 'JVM系列');
```
现在表里的数据就是这样的:
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/2ab2e19d985e462e87c1b6e7c50ebc5a.png)
假设插入该记录的事务id为60那么此刻该条记录的示意图如下所示
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/c7b3d5e8c3bd4d91942b0891b0db0956.png)
假设之后两个事务id分别为80、120的事务对这条记录进行UPDATE操作操作流程如下
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/85471f9eaddf4d42a51259b6878056ed.png)
每次对记录进行改动都会记录一条undo日志每条undo日志也都有一个roll_pointer属性INSERT操作对应的undo日志没有该属性因为该记录并没有更早的版本可以将这些undo日志都连起来串成一个链表所以现在的情况就像下图一样
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/c7dc3b48519b4961b04e03594ee80538.png)
对该记录每次更新后都会将旧值放到一条undo日志中就算是该记录的一个旧版本随着更新次数的增多所有的版本都会被roll_pointer属性连接成一个链表我们把这个链表称之为版本链版本链的头节点就是当前记录最新的值。另外每个版本中还包含生成该版本时对应的事务id。**于是可以利用这个记录的版本链来控制并发事务访问相同记录的行为,那么这种机制就被称之为多版本并发控制(Mulit-Version Concurrency Control MVCC)。**
#### 1.5.1.3.ReadView
**必须要知道的概念作用于SQL查询语句**
对于使用READ UNCOMMITTED隔离级别的事务来说由于可以读到未提交事务修改过的记录所以直接读取记录的最新版本就好了**所以就会出现脏读、不可重复读、幻读**)。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/5e3918aac91a4ee8b6a2de3011021922.png)
对于使用SERIALIZABLE隔离级别的事务来说InnoDB使用加锁的方式来访问记录**也就是所有的事务都是串行的,当然不会出现脏读、不可重复读、幻读**)。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/82450615bb5b4612aaccdd7008280f5e.png)
对于使用READ COMMITTED和REPEATABLE READ隔离级别的事务来说都必须保证读到已经提交了的事务修改过的记录也就是说假如另一个事务已经修改了记录但是尚未提交是不能直接读取最新版本的记录的核心问题就是READ COMMITTED和REPEATABLE READ隔离级别在不可重复读和幻读上的区别是从哪里来的其实结合前面的知识这两种隔离级别关键**是需要判断一下版本链中的哪个版本是当前事务可见的**。
**为此InnoDB提出了一个ReadView的概念作用于SQL查询语句**
这个ReadView中主要包含4个比较重要的内容
**m_ids**表示在生成ReadView时当前系统中活跃的读写事务的事务id列表。
**min_trx_id**表示在生成ReadView时当前系统中活跃的读写事务中最小的事务id也就是m_ids中的最小值。
**max_trx_id**表示生成ReadView时系统中应该分配给下一个事务的id值。注意max_trx_id并不是m_ids中的最大值事务id是递增分配的。比方说现在有id为123这三个事务之后id为3的事务提交了。那么一个新的读事务在生成ReadView时m_ids就包括1和2min_trx_id的值就是1max_trx_id的值就是4。
**creator_trx_id**表示生成该ReadView的事务的事务id。
#### 1.5.1.4.READ COMMITTED
##### 脏读问题的解决
READ COMMITTED隔离级别的事务在每次查询开始时都会生成一个独立的ReadView。
在MySQL中READ COMMITTED和REPEATABLE READ隔离级别的的一个非常大的区别就是它们生成ReadView的时机不同。
我们还是以表teacher 为例假设现在表teacher 中只有一条由事务id为60的事务插入的一条记录接下来看一下READ COMMITTED和REPEATABLE READ所谓的生成ReadView的时机不同到底不同在哪里。
READ COMMITTED —— 每次读取数据前都生成一个ReadView
比方说现在系统里有两个事务id分别为80、120的事务在执行Transaction 80
```
UPDATE teacher SET name = '马' WHERE number = 1;
UPDATE teacher SET name = '连' WHERE number = 1;
...
```
此刻表teacher 中number为1的记录得到的版本链表如下所示
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/bd1d16d019c9405ab12fca214e271053.png)
假设现在有一个使用READ COMMITTED隔离级别的事务开始执行
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/ce38f77cc7814319b8b8b8e6bf1c7997.png)
```
使用READ COMMITTED隔离级别的事务
BEGIN;
SELECE1Transaction 80、120未提交
SELECT * FROM teacher WHERE number = 1; # 得到的列name的值为'李瑾'
```
第1次select的时间点 如下图:
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1653285598056/2cb53fc2abf649ab88804b8bc4054127.png)
这个SELECE1的执行过程如下
在执行SELECT语句时会先生成一个ReadView
ReadView的m_ids列表的内容就是[80, 120]min_trx_id为80max_trx_id为121creator_trx_id为0。
然后从版本链中挑选可见的记录从图中可以看出最新版本的列name的内容是'**连**'该版本的trx_id值为80在m_ids列表内所以不符合可见性要求trx_id属性值在ReadView的min_trx_id和max_trx_id之间说明创建ReadView时生成该版本的事务还是活跃的该版本不可以被访问如果不在说明创建ReadView时生成该版本的事务已经被提交该版本可以被访问根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是'**马**'该版本的trx_id值也为80也在m_ids列表内所以也不符合要求继续跳到下一个版本。
下一个版本的列name的内容是'**李瑾**'该版本的trx_id值为60小于ReadView中的min_trx_id值所以这个版本是符合要求的最后返回给用户的版本就是这条列name为'**李瑾**'的记录。
**所以有了这种机制,就不会发生脏读问题!因为会去判断活跃版本,必须是不在活跃版本的才能用,不可能读到没有 commit的记录。**
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1653285598056/dd356cf81ec14665b7f11c82ec6021e9.png)
##### 不可重复读问题
然后我们把事务id为80的事务提交一下然后再到事务id为120的事务中更新一下表teacher 中number为1的记录
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/352c5da6030041ef820ba4408c670362.png)
```
Transaction120
BEGIN;
更新了一些别的表的记录
UPDATE teacher SET name = '严' WHERE number = 1;
UPDATE teacher SET name = '晁' WHERE number = 1;
```
此刻表teacher 中number为1的记录的版本链就长这样
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/7202b4c9114b440f9473bcfe9699ab74.png)
然后再到刚才使用READ COMMITTED隔离级别的事务中继续查找这个number为1的记录如下
使用READ COMMITTED隔离级别的事务
```
BEGIN;
SELECE1Transaction 80、120均未提交
SELECT * FROM teacher WHERE number = 1; # 得到的列name的值为'李瑾'
SELECE2Transaction 80提交Transaction 120未提交
SELECT * FROM teacher WHERE number = 1; # 得到的列name的值为'连'
```
**第2次select的时间点 如下图:**
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1653285598056/076acec8fbe7463cb9f2f709327cdfb5.png)
这个SELECE2的执行过程如下
SELECT * FROM teacher WHERE number = 1;
在执行SELECT语句时会又会单独生成一个ReadView该ReadView信息如下
m_ids列表的内容就是[120]事务id为80的那个事务已经提交了所以再次生成快照时就没有它了min_trx_id为120max_trx_id为121creator_trx_id为0。
然后从版本链中挑选可见的记录从图中可以看出最新版本的列name的内容是'**晁**'该版本的trx_id值为120在m_ids列表内所以不符合可见性要求根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是'**严**'该版本的trx_id值为120也在m_ids列表内所以也不符合要求继续跳到下一个版本。
下一个版本的列name的内容是'**连**'该版本的trx_id值为80小于ReadView中的min_trx_id值120所以这个版本是符合要求的最后返回给用户的版本就是这条列name为'**连**'的记录。
以此类推如果之后事务id为120的记录也提交了再次在使用READ COMMITTED隔离级别的事务中查询表teacher 中number值为1的记录时得到的结果就是'**晁**'了,具体流程我们就不分析了。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1653285598056/e183bd95aed6411aba3ded451871dbff.png)
##### 但会出现不可重复读问题。
明显上面一个事务中两次
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1653285598056/b1232c1150a646eda0637a914716e0fc.png)
#### 1.5.1.5.REPEATABLE READ
##### REPEATABLE READ解决不可重复读问题
REPEATABLE READ —— 在第一次读取数据时生成一个ReadView
对于使用REPEATABLE READ隔离级别的事务来说只会在第一次执行查询语句时生成一个ReadView之后的查询就不会重复生成了。我们还是用例子看一下是什么效果。
比方说现在系统里有两个事务id分别为80、120的事务在执行Transaction 80
```
UPDATE teacher SET name = '马' WHERE number = 1;
UPDATE teacher SET name = '连' WHERE number = 1;
...
```
此刻表teacher 中number为1的记录得到的版本链表如下所示
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/bd1d16d019c9405ab12fca214e271053.png)
假设现在有一个使用REPEATABLE READ隔离级别的事务开始执行
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/ce38f77cc7814319b8b8b8e6bf1c7997.png)
```
使用READ COMMITTED隔离级别的事务
BEGIN;
SELECE1Transaction 80、120未提交
SELECT * FROM teacher WHERE number = 1; # 得到的列name的值为'李瑾'
```
这个SELECE1的执行过程如下
在执行SELECT语句时会先生成一个ReadView
ReadView的m_ids列表的内容就是[80, 120]min_trx_id为80max_trx_id为121creator_trx_id为0。
然后从版本链中挑选可见的记录从图中可以看出最新版本的列name的内容是'**连**'该版本的trx_id值为80在m_ids列表内所以不符合可见性要求trx_id属性值在ReadView的min_trx_id和max_trx_id之间说明创建ReadView时生成该版本的事务还是活跃的该版本不可以被访问如果不在说明创建ReadView时生成该版本的事务已经被提交该版本可以被访问根据roll_pointer跳到下一个版本。
下一个版本的列name的内容是'**马**'该版本的trx_id值也为80也在m_ids列表内所以也不符合要求继续跳到下一个版本。
下一个版本的列name的内容是'**李瑾**'该版本的trx_id值为60小于ReadView中的min_trx_id值所以这个版本是符合要求的最后返回给用户的版本就是这条列name为'**李瑾**'的记录。
之后我们把事务id为80的事务提交一下然后再到事务id为120的事务中更新一下表teacher 中number为1的记录
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/352c5da6030041ef820ba4408c670362.png)
```
Transaction120
BEGIN;
更新了一些别的表的记录
UPDATE teacher SET name = '严' WHERE number = 1;
UPDATE teacher SET name = '晁' WHERE number = 1;
```
此刻表teacher 中number为1的记录的版本链就长这样
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/7202b4c9114b440f9473bcfe9699ab74.png)
然后再到刚才使用REPEATABLE READ隔离级别的事务中继续查找这个number为1的记录如下
使用READ COMMITTED隔离级别的事务
```
BEGIN;
SELECE1Transaction 80、120均未提交
SELECT * FROM teacher WHERE number = 1; # 得到的列name的值为'李瑾'
SELECE2Transaction 80提交Transaction 120未提交
SELECT * FROM teacher WHERE number = 1; # 得到的列name的值为'李瑾'
```
这个SELECE2的执行过程如下
因为当前事务的隔离级别为REPEATABLE READ而之前在执行SELECE1时已经生成过ReadView了所以此时直接复用之前的ReadView之前的ReadView的m_ids列表的内容就是[80, 120]min_trx_id为80max_trx_id为121creator_trx_id为0。
**根据前面的分析,返回的值还是'李瑾'。**
**也就是说两次SELECT查询得到的结果是重复的记录的列name值都是'李瑾',这就是可重复读的含义。**
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/64659425cf56414fba3a80c42c0538b7.png)
**总结一下就是:**
**ReadView中的比较规则(前两条)**
1、如果被访问版本的trx_id属性值与ReadView中的creator_trx_id值相同意味着当前事务在访问它自己修改过的记录所以该版本可以被当前事务访问。
2、如果被访问版本的trx_id属性值小于ReadView中的min_trx_id值表明生成该版本的事务在当前事务生成ReadView前已经提交所以该版本可以被当前事务访问。
#### 1.5.1.6.MVCC下的幻读解决和幻读现象
前面我们已经知道了REPEATABLE READ隔离级别下MVCC可以解决不可重复读问题那么幻读呢MVCC是怎么解决的幻读是一个事务按照某个相同条件多次读取记录时后读取时读到了之前没有读到的记录而这个记录来自另一个事务添加的新记录。
我们可以想想在REPEATABLE READ隔离级别下的事务T1先根据某个搜索条件读取到多条记录然后事务T2插入一条符合相应搜索条件的记录并提交然后事务T1再根据相同搜索条件执行查询。结果会是什么按照**ReadView中的比较规则(后两条)**
3、如果被访问版本的trx_id属性值大于或等于ReadView中的max_trx_id值表明生成该版本的事务在当前事务生成ReadView后才开启所以该版本不可以被当前事务访问。
4、如果被访问版本的trx_id属性值在ReadView的min_trx_id和max_trx_id之间(min_trx_id < trx_id < max_trx_id)那就需要判断一下trx_id属性值是不是在m_ids列表中如果在说明创建ReadView时生成该版本的事务还是活跃的该版本不可以被访问如果不在说明创建ReadView时生成该版本的事务已经被提交该版本可以被访问。
不管事务T2比事务T1是否先开启事务T1都是看不到T2的提交的。请自行按照上面介绍的版本链、ReadView以及判断可见性的规则来分析一下。
但是在REPEATABLE READ隔离级别下InnoDB中的MVCC 可以很大程度地避免幻读现象,而不是完全禁止幻读。怎么回事呢?我们来看下面的情况:
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/00b3c1b4774c47cb9a2ceb19d921b504.png)
我们首先在事务T1中
```
select * from teacher where number = 30;
```
很明显这个时候是找不到number = 30的记录的。
我们在事务T2中执行
```
insert into teacher values(30,'豹','数据湖');
```
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/f1935b415db04ac482e023c6406f8de3.png)
通过执行insert into teacher values(30,'豹','数据湖');我们往表中插入了一条number = 30的记录。
此时回到事务T1执行
```
update teacher set domain='RocketMQ' where number=30;
select * from teacher where number = 30;
```
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1651212459071/7ca9e16a31d84d5ca72fdb236a95eb28.png)
怎么回事事务T1很明显出现了幻读现象。
在REPEATABLE READ隔离级别下T1第一次执行普通的SELECT 语句时生成了一个ReadView但是版本链没有之后T2向teacher 表中新插入一条记录并提交然后T1也进行了一个update语句。
ReadView并不能阻止T1执行UPDATE 或者DELETE 语句来改动这个新插入的记录但是这样一来这条新记录的trx_id隐藏列的值就变成了T1的事务id。
![image.png](https://fynotefile.oss-cn-zhangjiakou.aliyuncs.com/fynote/fyfile/5983/1653285598056/92d29ec669db40b1a07fb0b3cc8cb730.png)
之后T1再使用普通的SELECT 语句去查询这条记录时就可以看到这条记录了也就可以把这条记录返回给客户端。因为这个特殊现象的存在我们也可以认为MVCC 并不能完全禁止幻读(**就是第一次读如果是空的情况,且在自己事务中进行了该条数据的修改**)。
#### 1.5.1.7.MVCC小结
从上边的描述中我们可以看出来所谓的MVCCMulti-Version Concurrency Control 多版本并发控制指的就是在使用READ COMMITTD、REPEATABLE READ这两种隔离级别的事务在执行普通的SELECT操作时访问记录的版本链的过程这样子可以使不同事务的读-写、写-读操作并发执行,从而提升系统性能。
READ COMMITTD、REPEATABLE READ这两个隔离级别的一个很大不同就是生成ReadView的时机不同READ COMMITTD在每一次进行普通SELECT操作前都会生成一个ReadView而REPEATABLE READ只在第一次进行普通SELECT操作前生成一个ReadView之后的查询操作都重复使用这个ReadView就好了从而基本上可以避免幻读现象**就是第一次读如果ReadView是空的情况中的某些情况则避免不了**)。
另外所谓的MVCC只是在我们进行普通的SEELCT查询时才生效截止到目前我们所见的所有SELECT语句都算是普通的查询至于什么是个不普通的查询后面马上就会讲到锁定读