2025年5月12日 (一) 00:24的版本

事务隔离级别

事务隔离级别（Transaction Isolation Levels）是数据库管理系统（DBMS）中用于控制事务并发执行时相互影响程度的重要机制。它定义了多个事务同时访问数据库时，一个事务对其他事务的可见性规则，从而在数据一致性和并发性能之间取得平衡。

概述

在数据库系统中，多个事务并发执行可能导致以下问题（称为并发问题）：

脏读（Dirty Read）：事务A读取了事务B未提交的修改。
不可重复读（Non-repeatable Read）：事务A多次读取同一数据，期间事务B修改了该数据，导致事务A前后读取结果不一致。
幻读（Phantom Read）：事务A多次执行同一查询，期间事务B插入或删除了符合查询条件的记录，导致事务A前后结果集不一致。

事务隔离级别通过限制这些现象的发生来保证数据一致性。SQL标准定义了4种隔离级别，按隔离强度从低到高排列如下：

四种标准隔离级别

1. 读未提交（Read Uncommitted）

最低隔离级别
允许事务读取其他事务未提交的修改（脏读）
可能出现所有并发问题
性能最高，但数据一致性最差

2. 读已提交（Read Committed）

只允许读取已提交的数据（避免脏读）
仍可能出现不可重复读和幻读
是许多数据库的默认级别（如Oracle、PostgreSQL）

3. 可重复读（Repeatable Read）

确保同一事务中多次读取同一数据结果一致（避免不可重复读）
仍可能出现幻读
是MySQL InnoDB的默认级别

4. 串行化（Serializable）

最高隔离级别
通过完全锁定相关数据避免所有并发问题
性能最差，但数据一致性最强

隔离级别对比表

隔离级别	脏读	不可重复读	幻读	并发性能
读未提交	可能	可能	可能	最高
读已提交	不可能	可能	可能	高
可重复读	不可能	不可能	可能	中
串行化	不可能	不可能	不可能	低

代码示例

以下是在MySQL中设置和查询事务隔离级别的示例：

-- 查询当前会话的隔离级别
SELECT @@transaction_isolation;

-- 设置全局隔离级别（需要管理员权限）
SET GLOBAL TRANSACTION ISOLATION LEVEL REPEATABLE READ;

-- 设置当前会话的隔离级别
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;

-- 事务示例
START TRANSACTION;
-- 在此执行SQL操作
COMMIT;

实际案例

场景：银行转账系统

考虑两个并发事务： 1. 事务A：查询账户余额（1000元） 2. 事务B：从该账户转账200元（更新余额为800元）

在不同隔离级别下的表现：

读未提交：

 - 事务A可能在事务B提交前读取到800元（脏读）

读已提交：

 - 事务A不会读到未提交的修改
 - 但如果事务A再次查询，可能看到800元（不可重复读）

可重复读：

 - 事务A在整个事务中看到一致的1000元
 - 但如果执行范围查询（如"SELECT COUNT(*) WHERE balance > 500"），可能看到不同结果（幻读）

串行化：

 - 事务B会等待事务A完成，或反之，确保完全一致

数学表达

隔离级别可以用可串行化理论来描述。对于调度S，如果存在一个等价于某个串行调度的调度S'，则称S是可串行化的。

$C o n f l i c t (S) \equiv {(p_{i}, q_{j}) | p_{i} \in T_{i}, q_{j} \in T_{j}, i \neq j, p_{i} 与 q_{j} 冲突}$

其中冲突操作指至少有一个是写操作且访问同一数据项。

选择建议

选择隔离级别时应考虑：

数据一致性要求
系统并发需求
性能要求

一般建议：

对数据准确性要求高的系统（如金融）使用可重复读或串行化
对性能要求高且能容忍一定程度不一致的系统（如内容管理）使用读已提交
读未提交通常只用于统计分析等非关键场景

总结

事务隔离级别是数据库并发控制的核心概念，理解不同级别的特性和适用场景对设计可靠的数据系统至关重要。开发者应根据应用需求选择合适的隔离级别，在数据一致性和系统性能之间取得平衡。

@@ 第1行： / 第1行： @@
 = 事务隔离级别 =
-事务隔离级别（Transaction Isolation Levels）是数据库系统中用于控制事务并发执行时相互影响程度的重要机制。它定义了多个事务同时访问和修改数据时，系统如何保证数据的完整性和一致性。理解隔离级别对于设计高性能、可靠的数据库应用至关重要。
+事务隔离级别（Transaction Isolation Levels）是数据库管理系统（DBMS）中用于控制事务并发执行时相互影响程度的重要机制。它定义了多个事务同时访问数据库时，一个事务对其他事务的可见性规则，从而在数据一致性和并发性能之间取得平衡。
-== 基本概念 ==
+== 概述 ==
-在数据库系统中，事务（Transaction）是指作为单个逻辑工作单元执行的一系列操作。事务具有ACID特性：
+在数据库系统中，多个事务并发执行可能导致以下问题（称为'''并发问题'''）：
-* '''原子性'''（Atomicity）：事务中的所有操作要么全部完成，要么全部不执行
+* '''脏读（Dirty Read）'''：事务A读取了事务B未提交的修改。
-* '''一致性'''（Consistency）：事务执行前后，数据库从一个一致状态变为另一个一致状态
+* '''不可重复读（Non-repeatable Read）'''：事务A多次读取同一数据，期间事务B修改了该数据，导致事务A前后读取结果不一致。
-* '''隔离性'''（Isolation）：并发事务的执行互不干扰
+* '''幻读（Phantom Read）'''：事务A多次执行同一查询，期间事务B插入或删除了符合查询条件的记录，导致事务A前后结果集不一致。
-* '''持久性'''（Durability）：事务一旦提交，其结果永久保存
-'''隔离级别'''专门解决隔离性方面的问题，它决定了：
+事务隔离级别通过限制这些现象的发生来保证数据一致性。SQL标准定义了4种隔离级别，按隔离强度从低到高排列如下：
-* 一个事务能看到其他事务的哪些修改
-* 并发事务之间如何相互影响
-== 标准隔离级别 ==
+== 四种标准隔离级别 ==
-SQL标准定义了4种隔离级别，按照隔离强度从低到高排列：
 === 1. 读未提交（Read Uncommitted） ===
-最低的隔离级别，允许事务读取其他事务尚未提交的修改（"脏读"）。
+* 最低隔离级别
+* 允许事务读取其他事务未提交的修改（脏读）
-'''特点'''：
+* 可能出现所有并发问题
-* 可能发生脏读、不可重复读和幻读
 * 性能最高，但数据一致性最差
 === 2. 读已提交（Read Committed） ===
-只允许读取已提交的数据，解决了脏读问题。
+* 只允许读取已提交的数据（避免脏读）
+* 仍可能出现不可重复读和幻读
-'''特点'''：
+* 是许多数据库的默认级别（如Oracle、PostgreSQL）
-* 防止脏读
-* 仍可能发生不可重复读和幻读
-* 大多数数据库的默认级别（如Oracle、PostgreSQL）
 === 3. 可重复读（Repeatable Read） ===
-确保在同一事务中多次读取同一数据结果一致。
+* 确保同一事务中多次读取同一数据结果一致（避免不可重复读）
+* 仍可能出现幻读
+* 是MySQL InnoDB的默认级别
-'''特点'''：
+=== 4. 串行化（Serializable） ===
-* 防止脏读和不可重复读
+* 最高隔离级别
-* 仍可能发生幻读
+* 通过完全锁定相关数据避免所有并发问题
-* MySQL的InnoDB默认级别
+* 性能最差，但数据一致性最强
-=== 4. 可串行化（Serializable） ===
+<mermaid>
-最高的隔离级别，完全串行执行事务，如同单线程。
+graph LR
+    A[读未提交] -->|允许脏读| B[读已提交]
-'''特点'''：
+    B -->|避免脏读| C[可重复读]
-* 防止所有并发问题
+    C -->|避免不可重复读| D[串行化]
-* 性能最低
+    D -->|避免幻读| E[最高一致性]
-* 通过锁机制实现
+</mermaid>
-== 并发问题 ==
+== 隔离级别对比表 ==
-不同隔离级别旨在解决以下并发问题：
 {| class="wikitable"
-|+ 隔离级别与并发问题
-! 隔离级别 !! 脏读 !! 不可重复读 !! 幻读
 |-
-| 读未提交 || 可能 || 可能 || 可能
+! 隔离级别 !! 脏读 !! 不可重复读 !! 幻读 !! 并发性能
 |-
-| 读已提交 || 不可能 || 可能 || 可能
+| 读未提交 || 可能 || 可能 || 可能 || 最高
 |-
-| 可重复读 || 不可能 || 不可能 || 可能
+| 读已提交 || 不可能 || 可能 || 可能 || 高
 |-
-| 可串行化 || 不可能 || 不可能 || 不可能
+| 可重复读 || 不可能 || 不可能 || 可能 || 中
+|-
+| 串行化 || 不可能 || 不可能 || 不可能 || 低
 |}
-=== 脏读（Dirty Read） ===
-事务A读取了事务B'''未提交'''的修改，如果事务B回滚，事务A读取的就是无效数据。
-=== 不可重复读（Non-repeatable Read） ===
-事务A多次读取同一数据，期间事务B修改了该数据并提交，导致事务A前后读取结果不一致。
-=== 幻读（Phantom Read） ===
-事务A读取符合某些条件的记录集，期间事务B插入/删除了符合条件的记录并提交，导致事务A再次读取时结果集发生变化。
 == 代码示例 ==
-以下SQL示例展示不同隔离级别的行为差异：
+以下是在MySQL中设置和查询事务隔离级别的示例：
 <syntaxhighlight lang="sql">
--- 会话1
+-- 查询当前会话的隔离级别
-BEGIN TRANSACTION;
+SELECT @@transaction_isolation;
-SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED;
-SELECT balance FROM accounts WHERE id = 1;  -- 读取未提交数据
--- 会话2
+-- 设置全局隔离级别（需要管理员权限）
-BEGIN TRANSACTION;
+SET GLOBAL TRANSACTION ISOLATION LEVEL REPEATABLE READ;
-UPDATE accounts SET balance = balance - 100 WHERE id = 1;
--- 尚未提交
--- 会话1再次读取
+-- 设置当前会话的隔离级别
-SELECT balance FROM accounts WHERE id = 1;  -- 看到未提交的修改
+SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;
+-- 事务示例
+START TRANSACTION;
+-- 在此执行SQL操作
 COMMIT;
--- 会话2
-ROLLBACK;  -- 撤销修改，会话1读取了"脏数据"
 </syntaxhighlight>
 == 实际案例 ==
-'''电商库存管理场景'''：
+'''场景：'''银行转账系统
+考虑两个并发事务：
+. 事务A：查询账户余额（1000元）
+. 事务B：从该账户转账200元（更新余额为800元）
+在不同隔离级别下的表现：
+* '''读未提交'''：
+  - 事务A可能在事务B提交前读取到800元（脏读）
+* '''读已提交'''：
+  - 事务A不会读到未提交的修改
+  - 但如果事务A再次查询，可能看到800元（不可重复读）
-. '''问题'''：两个用户同时购买最后一件商品
+* '''可重复读'''：
-. '''隔离级别选择'''：需要可重复读或可串行化
+  - 事务A在整个事务中看到一致的1000元
-. '''解决方案'''：
+  - 但如果执行范围查询（如"SELECT COUNT(*) WHERE balance > 500"），可能看到不同结果（幻读）
-<mermaid>
+* '''串行化'''：
-sequenceDiagram
+  - 事务B会等待事务A完成，或反之，确保完全一致
-    participant UserA
-    participant UserB
-    participant DB
-    UserA->>DB: BEGIN (Repeatable Read)
-    DB->>UserA: 读取库存(剩余1)
-    UserB->>DB: BEGIN (Repeatable Read)
-    DB->>UserB: 读取库存(剩余1)
-    UserA->>DB: 下单并减库存
-    DB->>UserA: 成功
-    UserA->>DB: COMMIT
-    UserB->>DB: 下单并减库存
-    DB->>UserB: 失败(库存不足)
-    UserB->>DB: ROLLBACK
-</mermaid>
 == 数学表达 ==
-隔离级别可以形式化表示为可见性规则。设<math>T_i</math>和<math>T_j</math>是两个事务：
+隔离级别可以用'''可串行化'''理论来描述。对于调度S，如果存在一个等价于某个串行调度的调度S'，则称S是可串行化的。
-* '''读已提交'''：<math>T_i</math>只能看到<math>T_j</math>已提交的写入
+<math>
-* '''可重复读'''：<math>T_i</math>在其生命周期内对同一数据的多次读取结果一致
+Conflict(S) \equiv \{(p_i,q_j) | p_i \in T_i, q_j \in T_j, i \neq j, p_i \text{与} q_j \text{冲突}\}
-* '''可串行化'''：存在一个串行调度等价于实际并发执行
+</math>
+其中冲突操作指至少有一个是写操作且访问同一数据项。
 == 选择建议 ==
-选择隔离级别时需权衡：
+选择隔离级别时应考虑：
-* '''数据一致性'''要求越高，隔离级别应越高
+* 数据一致性要求
-* '''性能'''要求越高，隔离级别应越低
+* 系统并发需求
-* 常见实践：
+* 性能要求
-  ** 读密集型应用：读已提交
-  ** 财务系统：可重复读或可串行化
+一般建议：
-  ** 报表系统：读未提交（不要求精确性时）
+* 对数据准确性要求高的系统（如金融）使用'''可重复读'''或'''串行化'''
+* 对性能要求高且能容忍一定程度不一致的系统（如内容管理）使用'''读已提交'''
+* '''读未提交'''通常只用于统计分析等非关键场景
 == 总结 ==
-事务隔离级别是数据库并发控制的核心机制，开发者应根据应用场景选择适当的级别。理解每种级别的特性和潜在问题，有助于设计出既高效又可靠的数据库应用。
+事务隔离级别是数据库并发控制的核心概念，理解不同级别的特性和适用场景对设计可靠的数据系统至关重要。开发者应根据应用需求选择合适的隔离级别，在数据一致性和系统性能之间取得平衡。
 [[Category:计算机科学]]
-[[Category:数据库与信息系统]]
+[[Category:面试技巧]]
-[[Category:数据库事务与并发控制]]
+[[Category:数据库基础]]