ZooKeeper 核心原理专栏导览

专栏定位

本专栏聚焦 Apache ZooKeeper 分布式协调服务的核心原理——从 ZNode 树形数据模型和 Watcher 通知机制，到 ZAB 协议的崩溃恢复与消息广播，再到分布式锁、配置中心、服务发现等典型应用场景。ZooKeeper 是 Kafka、Dubbo、HDFS、HBase 等众多分布式系统的基础设施——理解它的内部机制，是理解整个分布式生态的起点。

目标读者

使用依赖 ZooKeeper 的中间件但希望理解其底层原理的后端/大数据工程师
需要设计分布式锁、配置中心等协调服务的架构师
对分布式共识协议（Paxos/ZAB/Raft）感兴趣的技术爱好者

专栏目录

序号	标题	核心内容
01	01 ZooKeeper 全局架构——数据模型与会话机制	ZNode 树形数据模型（持久/临时/有序）、Watcher 机制的一次性通知、Session 的生命周期与心跳、ACL 权限控制
02	02 ZAB 协议——崩溃恢复与消息广播	ZAB vs Paxos vs Raft 的对比、Leader 选举（Fast Leader Election）、崩溃恢复的 ZXID 比较、消息广播的两阶段提交、Observer 节点的引入
03	03 ZooKeeper 的典型应用——分布式锁、配置中心与服务发现	临时有序节点实现分布式锁、Curator 的 InterProcessMutex、动态配置管理、服务注册与发现模式
04	04 ZooKeeper 内部——事务日志、快照与数据恢复	事务日志（WAL）的写入机制、快照的 Fuzzy Snapshot 策略、启动时的数据恢复流程、磁盘 IO 对性能的影响
05	05 ZooKeeper 的局限性与替代方案	性能瓶颈（写性能受限于 Leader 单点）、不适合大数据量存储、CP 模型在网络分区时的不可用、ETCD/Nacos/Consul 的对比选型
06	06 ZooKeeper 运维——集群部署、监控与调优	三节点/五节点的部署建议、Four Letter Words 监控命令、JVM 参数调优、滚动升级、常见故障（Session Expired/Connection Loss）

推荐阅读路径

核心原理路径：01 → 02 → 04

应用实践路径：03 → 05

运维路径：06

前置知识

分布式系统基础概念（CAP 定理、一致性模型）
建议对比阅读 etcd 专栏了解 Raft 协议（与 ZAB 形成对照）

关联专栏

etcd：Raft vs ZAB 的对比选型
分布式共识：ZAB 协议的理论基础
分布式锁：ZK 实现分布式锁的方案
Kafka：Kafka 早期依赖 ZK 做元数据管理
Dubbo：Dubbo 默认注册中心