[MySQL]对于事务并发处理带来的问题,脏读、不可重复读、幻读的理解与数据库

时间:2022-05-16 06:54:08

刚开始写博客.. 写的太low。

  1、数据库的两种读,每种读读的数据版本不一样,所以也称为MVCC,即多版本并发控制

    a) 快照读 

      select * from where xxx  这种形式的都是快照读。

    b) 当前读

      update , insert ,delete ,select xx from xx for update ,  in share mode 都是当前读

      当前读会等待,不会返回数据的历史版本

  2、mvcc 的实现原理

    mvcc是基于read view、活跃事务列表 做的,以后的文章我会专门分析这块。

  3、mysql 是如何解决脏读、幻读、不可重复读的

    a) 在快照读下是用的mvcc 做的 ,mysql RR 下 会产生幻读!!  

      快照读下数据的可见返回 = mvcc 当前事务加锁的行  

    b) 在当前读使用 锁

      加上锁了,别的事务要修改只能等待,自然也就没有各种问题了

  总结:innodb默认使用的mvcc 锁的混合模式。innodb的RR模式并没有完全解决幻读的问题。

       mvcc 和 锁 都可以解决幻读、重复读问题。两者方式不一样,前者通过冗余数据,后者通过锁。

 

阅读目录

回到顶部

一 数据库事务的隔离级别

数据库事务的隔离级别有4个,由低到高依次为Read uncommitted 、Read committed 、Repeatable read 、Serializable ,这四个级别可以逐个解决脏读 、不可重复读 、幻读这几类问题。

 [MySQL]对于事务并发处理带来的问题,脏读、不可重复读、幻读的理解与数据库

1. Read UnCommitted(读未提交)

最低的隔离级别。一个事务可以读取另一个事务并未提交的更新结果。

2. Read Committed(读提交)

大部分数据库采用的默认隔离级别。一个事务的更新操作结果只有在该事务提交之后,另一个事务才可以的读取到同一笔数据更新后的结果。

3. Repeatable Read(重复读)

mysql的默认级别。整个事务过程中,对同一笔数据的读取结果是相同的,不管其他事务是否在对共享数据进行更新,也不管更新提交与否。

4. Serializable(序列化)

最高隔离级别。所有事务操作依次顺序执行。注意这会导致并发度下降,性能最差。通常会用其他并发级别加上相应的并发锁机制来取代它。

 

 

 

回到顶部

二 不同事务级别带来的并发问题

1 脏读

脏读发生在一个事务A读取了被另一个事务B修改,但是还未提交的数据。假如B回退,则事务A读取的是无效的数据。这跟不可重复读类似,但是第二个事务不需要执行提交。 

[MySQL]对于事务并发处理带来的问题,脏读、不可重复读、幻读的理解与数据库

 

2 不可重复读

在基于锁的并行控制方法中,如果在执行select时不添加读锁,就会发生不可重复读问题。

在多版本并行控制机制中,当一个遇到提交冲突的事务需要回退但却被释放时,会发生不可重复读问题。

[MySQL]对于事务并发处理带来的问题,脏读、不可重复读、幻读的理解与数据库

在上面这个例子中,事务2提交成功,它所做的修改已经可见。然而,事务1已经读取了一个其它的值。在序列化和可重复读的隔离级别中,数据库管理系统会返回旧值,即在被事务2修改之前的值。在提交读和未提交读隔离级别下,可能会返回被更新的值,这就是“不可重复读”。

 

有两个策略可以防止这个问题的发生:

(1) 推迟事务2的执行,直至事务1提交或者回退。这种策略在使用锁时应用。

(2) 而在多版本并行控制中,事务2可以被先提交。而事务1,继续执行在旧版本的数据上。当事务1终于尝试提交时,数据库会检验它的结果是否和事务1、事务2顺序执行时一样。如果是,则事务1提交成功。如果不是,事务1会被回退。

 

 

幻读 

幻读发生在当两个完全相同的查询执行时,第二次查询所返回的结果集跟第一个查询不相同。

发生的情况:没有范围锁。

[MySQL]对于事务并发处理带来的问题,脏读、不可重复读、幻读的理解与数据库

 

 

回到顶部

三 例子比较不可重复读和幻读

1 不可重复读

不可重复读的重点是修改: 同样的条件, 你读取过的数据, 再次读取出来发现值不一样了

例子:

在事务1中,Mary 读取了自己的工资为1000,操作并没有完成 

con1 = getConnection();  
select salary from employee empId ="Mary";  

在事务2中,这时财务人员修改了Mary的工资为2000,并提交了事务. 

con2 = getConnection();  
update employee set salary = 2000;  
con2.commit(); 

在事务1中,Mary 再次读取自己的工资时,工资变为了2000 

select salary from employee empId ="Mary"; 

在一个事务中前后两次读取的结果并不致,导致了不可重复读。

 

 

 2 幻读

幻读的重点在于 新增或者删除 (数据条数变化)。同样的条件, 第1次和第2次读出来的记录数不一样

例子:

目前工资为1000的员工有10人。 
事务1,读取所有工资为1000的员工。 

con1 = getConnection();  
Select * from employee where salary =1000;  

共读取10条记录 

这时另一个事务向employee表插入了一条员工记录,工资也为1000 

con2 = getConnection();  
Insert into employee(empId,salary) values("Lili",1000);  
con2.commit();  

事务1再次读取所有工资为1000的员工 

select * from employee where salary =1000;  

共读取到了11条记录,这就像产生了幻读。 

一、缘由

  众所周知MySQL从5.5.8开始,Innodb就是默认的存储引擎,Innodb最大的特点是:支持事务、支持行级锁。

既然支持事务,那么就会有处理并发事务带来的问题:更新丢失、脏读、不可重复读、幻读;相应的为了解决这四个问题,

就产生了事务隔离级别:未提交读(Read uncommitted),已提交读(Read committed),可重复读(Repeatable read),可序列化(Serializable)。

  之前在看事务隔离级别的时候,基本是一知半解。再次碰到,还是浆糊,所以这里打算彻底搞明白、清楚,也好后续的学习。

 

二、解决办法:

1、概念说明:   

  更新丢失:最后的更新覆盖了其他事务之前的更新,而事务之间并不知道,发生更新丢失。更新丢失,可以完全避免,应用对访问的数据加锁即可。

  脏读:(针对未提交的数据)一个事务在更新一条记录,未提交前,第二个事务读到了第一个事务更新后的记录,那么第二个事务就读到了脏数据,会产生对第一个未提交

数据的依赖。一旦第一个事务回滚,那么第二个事务读到的数据,将是错误的脏数据。

  不可重复读:(读取数据本身的对比)一个事务在读取某些数据后的一段时间后,再次读取这个数据,发现其读取出来的数据内容已经发生了改变,就是不可重复读。

  幻读:(读取结果集条数的对比)一个事务按相同的查询条件查询之前检索过的数据,确发现检索出来的结果集条数变多或者减少(由其他事务插入、删除的),类似产生幻觉。

 

2、不可重复读和幻读的区别:

不可重复读

重点是修改:同样的条件下,你读取过的数据,再次读取发现值不一样了。

例子:(只是为了说明区别,没有事务隔离级别约束)

事务1:Jack读取自己的工资为1000,事务并没有结束:

select salary from employee empId ="Jack"; 

 

事务2:财务人员修改了Jack的工资为2000,并提交事务(事务1不知道):

update employee set salary = 2000;

commit;

在事务1中,再次读取Jack的工资时,工资变为2000

select salary from employee empId ="Jack";

 

在一个事务中前后两次读取的结果值并不一致,导致了不可重读读

 

幻读

重点在于新增或者删除(数据条数的变化):同样条件下,第一次和第二次读出来的记录条数不一样。

例子:

目前工资为1000的员工有10人。

事务1:读取所有工资为1000的员工,事务进行中

select count(*) from employee where salary = 1000;

共读取到10条记录。

事务2:同时插入一条新的员工记录,工资也为1000

insert into employee(empId, salary) values(‘Tom‘, 1000);

commit;

事务1:再次读取所有工资为1000的员工

select count(*) from employee where salary = 1000;

共读取到了11条记录,这样就像产生了幻读。

 

三、事务隔离级别:

  并发处理带来的问题中,更新丢失可以完全避免,由应用对数据加锁即可。脏读、不可重读度、幻读,其实都是数据库的一致性问题,必须由一定的事务隔离机制来解决。

其中一种方法是:不用加锁,通过一定的机制生成一个数据请求时间点的一致性快照,并用这个快照来提供一个界别的一致性读取。从用户的角度看,好像是数据库提偶拱了

统一数据的多个版本。这种技术叫做:数据库多版本并发控制,MVCC 多版本数据库。

  事务隔离的本质是使事务在一定程度上串行化执行,显然和并发机制是矛盾的。数据库的事务隔离越严格,并发负作用越小,代价越高(影响并发访问了呗)。

  为了解决隔离和并大的矛盾,IOS SQL92规定了4个隔离级别。(隔离==串行

 

[MySQL]对于事务并发处理带来的问题,脏读、不可重复读、幻读的理解与数据库

MySQL 默认的级别是:Repeatable read 可重复读。