00 链路追踪专栏导览
摘要:
链路追踪(Distributed Tracing)是可观测性体系中**定位”请求在哪里慢了、在哪里出错了”**的核心手段。本专栏以 Apache SkyWalking 为主线,从链路追踪的理论基础(Dapper 论文、Trace/Span 数据模型)出发,经过 OpenTelemetry 统一标准的梳理,深入 SkyWalking 的 Agent 字节码增强、OAP 流处理引擎、采样策略等工程实现,最终落地到生产环境的实践经验。
专栏目录
| 序号 | 文章标题 | 核心问题 |
|---|---|---|
| 01 | 01 为什么需要链路追踪 | 从单体到微服务,调试困境如何催生链路追踪? |
| 02 | 02 链路追踪核心概念 | Trace、Span、Context Propagation 的精确定义与设计动机 |
| 03 | 03 OpenTelemetry 统一标准 | OTel 为什么能统一链路追踪标准?API/SDK/Collector 三层架构 |
| 04 | 04 SkyWalking 整体架构深度解析 | Agent/OAP/UI 三层架构、数据流、存储选型 |
| 05 | 05 SkyWalking Java Agent 字节码增强原理 | Byte Buddy 如何实现无侵入埋点?插件机制解析 |
| 06 | 06 SkyWalking 采样策略与性能影响 | 全量/概率/自适应采样的取舍与工程配置 |
| 07 | 07 SkyWalking OAP 流处理与存储模型 | Segment 聚合、拓扑发现、ES/BanyanDB 存储引擎 |
| 08 | 08 链路追踪工程实践落地经验 | 跨线程/跨进程传播、采样调优、与指标/日志联动 |
推荐阅读路径
阅读建议
- 零基础:01 → 02 → 03 → 04,先建立完整的概念体系
- SkyWalking 使用者:04 → 05 → 06 → 07,深入理解内部机制
- 架构师/选型决策者:01 → 03 → 08,关注标准与实践