MySQL 架构与底层原理专栏导览

摘要： 本专栏从 MySQL 的整体架构出发，逐层下钻到 InnoDB 存储引擎的核心子系统，系统性地回答一个核心问题：一条 SQL 从客户端发出到最终落盘，中间经历了哪些环节？每个环节为什么要这样设计？如果不这样设计会付出什么代价？ 专栏不追求面面俱到地罗列所有模块，而是沿着”数据流”和”控制流”两条主线，抓住最核心的六大子系统（缓冲池、日志系统、索引结构、事务与锁、执行引擎、复制架构）进行深度剖析。

专栏定位

本专栏与同目录下的《MySQL 高级特性》专栏形成互补。本专栏侧重”理解 MySQL”——即存储引擎内核机制、事务并发控制的底层实现、数据在磁盘和内存之间如何流转；而《MySQL 高级特性》专栏侧重”用好 MySQL”——即面向开发者的高级 SQL 能力和运维诊断工具。

与《读书笔记-Mysql内核架构》系列的区别

同目录下已有一套 19 篇的《读书笔记-Mysql内核架构》系列，该系列偏重逐章跟读式的笔记整理。本专栏则是独立的原创深度解析，以”问题驱动”而非”章节跟读”的方式组织内容，更注重原理推导链的完整性和工程实践的关联性。两者在部分主题上有交集（如缓冲池、日志系统），但切入角度和深度层次不同，可互为参考。

专栏目录

序号	文件名	核心摘要
01	01 MySQL 全局架构——一条 SQL 的完整生命周期	从客户端连接开始，沿着”连接层 → Server 层（解析器 → 优化器 → 执行器）→ 存储引擎层”的路径，完整追踪一条 SELECT 和一条 UPDATE 的执行流程。重点讲清每一层的职责边界、Server 层与存储引擎的 Handler API 接口设计，以及为什么 MySQL 选择了”插件式存储引擎”这条独特的架构路线
02	02 InnoDB Buffer Pool——内存与磁盘之间的桥梁	为什么数据库不能每次都直接读写磁盘？Buffer Pool 的 LRU 变种算法（Young/Old 分区）设计动机，预读（Read-Ahead）机制如何减少随机 I/O，脏页刷新策略（Checkpoint 机制）如何在性能与持久性之间取舍，Buffer Pool 多实例的并发优化
03	03 InnoDB 日志系统——WAL 协议与崩溃恢复的工程实现	WAL（Write-Ahead Logging）协议的数学本质：为什么”先写日志再写数据”能保证持久性？Redo Log 的环形缓冲区设计、LSN（Log Sequence Number）的全局递增语义、`innodb_flush_log_at_trx_commit` 三种模式的持久性-性能权衡、Redo Log 与 Binlog 的两阶段提交（2PC）协调机制
04	04 Undo Log 与 MVCC——多版本并发控制的实现真相	Undo Log 的双重角色：事务回滚的”后悔药”与 MVCC 的”时光机”。回滚段（Rollback Segment）的物理组织、版本链（Version Chain）的构建过程、ReadView 的”快照”语义——四个边界值如何判定一行数据对当前事务是否可见？长事务导致 Undo 膨胀的根因分析
05	05 InnoDB 索引结构——B+Tree 的工程哲学与页分裂机制	为什么是 B+Tree 而不是 B-Tree、哈希表或 LSM-Tree？聚簇索引与二级索引的物理存储差异、页内记录的链表组织与 Page Directory 的二分查找、页分裂（Page Split）与页合并（Page Merge）的触发条件与代价、自增主键为什么比 UUID 更适合 InnoDB
06	06 InnoDB 行格式与数据页结构——字节级的存储解剖	COMPACT、DYNAMIC、COMPRESSED 三种行格式的内存布局差异，变长字段长度列表与 NULL 标志位的编码方式，溢出页（Overflow Page）的触发阈值（为什么是 768 字节？），16KB 数据页的内部结构（File Header → Page Header → Infimum/Supremum → User Records → Page Directory → File Trailer）逐段拆解
07	07 InnoDB 锁机制——从记录锁到间隙锁的并发控制体系	为什么 InnoDB 选择行级锁而非表级锁？记录锁（Record Lock）、间隙锁（Gap Lock）、临键锁（Next-Key Lock）的语义差异与加锁规则，意向锁如何实现表级与行级锁的快速兼容性判断，死锁检测的等待图（Wait-for Graph）算法，不同隔离级别下的加锁行为差异
08	08 InnoDB 事务隔离级别——从脏读到幻读的防御工程	四种隔离级别不是”背诵题”而是”工程权衡题”。READ COMMITTED 与 REPEATABLE READ 在 ReadView 创建时机上的唯一差别如何导致截然不同的可见性行为，RR 级别下的”幻读”到底防住了没有（当前读 vs 快照读的微妙区别），SERIALIZABLE 的实现代价
09	09 MySQL 查询优化器——从 SQL 到执行计划的决策过程	优化器的核心任务：在指数级的执行计划空间中找到”足够好”的方案。逻辑优化（谓词下推、外连接消除、子查询转换）与物理优化（索引选择、JOIN 顺序、访问方法）的分工，Cost Model 的代价公式拆解，`EXPLAIN` 输出的逐字段深度解读，优化器为什么会”选错索引”的典型场景
10	10 Binlog 与主从复制——数据同步的架构演进	Binlog 的三种格式（STATEMENT / ROW / MIXED）的工程权衡，主从复制的三线程模型（Dump Thread → I/O Thread → SQL Thread），半同步复制如何在性能与数据安全之间找到平衡点，GTID 如何解决传统基于位点复制的痛点，并行复制（Parallel Replication）从库级到行级的演进历程

阅读建议

第 1 篇 是全局地图，建议所有读者首先阅读，建立对 MySQL 架构的全景认知
第 2-4 篇 沿着”内存管理 → 日志持久化 → 多版本并发”的数据流主线展开，是理解 InnoDB 的核心三角
第 5-6 篇 深入存储层的物理结构，适合需要理解索引设计与存储优化的读者
第 7-8 篇 聚焦并发控制，是排查锁等待、死锁问题的必备知识
第 9 篇 揭开优化器黑盒，是理解”为什么我的 SQL 跑得慢”的关键
第 10 篇 覆盖复制架构，是理解 MySQL 高可用方案的基础

前置知识

本专栏假设读者具备基本的 SQL 能力和操作系统基础知识（进程、内存、磁盘 I/O）。如需了解 MySQL 的高级 SQL 特性（窗口函数、CTE、JSON 等），请参阅同目录下的《MySQL 高级特性》专栏。

关联专栏

MySQL 进阶使用：基于底层原理的实战调优、分库分表、高可用架构
MyBatis：ORM 层的 SQL 生成与 MySQL 执行计划的交互
文件系统专栏：InnoDB 的数据页、redo log 与磁盘 IO 的关系
内存管理专栏：Buffer Pool 与 Page Cache 的协作与竞争
分布式事务：MySQL XA 事务与分布式事务的关系

汀的知识碎片

文章导航

00 专栏导览

MySQL 架构与底层原理专栏导览

专栏目录

阅读建议

关联专栏

On this page

Backlinks