汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: 容错
11 items with this tag.
Mar 02, 2026
状态管理与 Checkpoint 实战
Flink
State
Checkpoint
Savepoint
ValueState
MapState
TTL
容错
实战
Mar 02, 2026
Flink 与 Kafka 端到端精确一次实战
Flink
Kafka
精确一次
Exactly-Once
两阶段提交
KafkaSink
事务
容错
Mar 02, 2026
Flink Checkpoint 机制深度解析
Flink
Checkpoint
Chandy-Lamport
Barrier
精确一次
容错
Savepoint
Unaligned-Checkpoint
Feb 28, 2026
Spark 容错与状态管理深度解析 —— 专栏导览
Spark
容错
状态管理
Checkpoint
Lineage
Structured-Streaming
State-Store
Feb 28, 2026
RDD Lineage 血缘容错:分布式计算的重建之道
Spark
RDD
Lineage
容错
窄依赖
宽依赖
DAGScheduler
分区重算
Feb 28, 2026
Task 与 Stage 的多级重试机制
Spark
容错
Task重试
Stage重试
推测执行
FetchFailedException
TaskScheduler
DAGScheduler
Feb 28, 2026
RDD Checkpoint:截断 Lineage 的工程权衡
Spark
RDD
Checkpoint
Lineage
容错
迭代算法
HDFS
localCheckpoint
persist
Feb 28, 2026
Structured Streaming 容错模型:Offset 与 Checkpoint
Spark
Structured-Streaming
容错
Checkpoint
Offset
Epoch
Exactly-once
StreamExecution
Feb 28, 2026
故障恢复全流程拆解:从宕机到续跑
Spark
容错
故障恢复
Executor崩溃
Driver重启
Structured-Streaming
YARN
全流程
Feb 28, 2026
生产容错调优手册:从告警到根因的系统性诊断
Spark
容错
生产调优
故障诊断
Task失败
Stage回滚
State-Store-OOM
Watermark
FetchFailedException
Feb 27, 2026
HDFS 容错与恢复机制——自愈修复的工程实现
HDFS
容错
副本恢复
DataNode心跳
脑裂
Block恢复
Lease-Recovery