汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: SRE
9 items with this tag.
Apr 13, 2026
00 专栏导览:大数据集群 SRE 的 AiOps 工程实践
AiOps
SRE
大数据
智能运维
专栏导览
Apr 13, 2026
01 AiOps 是什么:从救火到防火的运维范式革命
AiOps
SRE
智能运维
运维范式
DevOps
Apr 13, 2026
10 AiOps 闭环:从感知到自愈的完整链路设计
AiOps
闭环
自愈
预测性运维
成熟度模型
SRE
大数据
Mar 24, 2026
NameNode 崩溃复盘:HDFS QJM 写超时与 KDC UDP 丢包根因分析(2026-03-20)
HDFS
Kerberos
NameNode
QJM
故障复盘
SRE
Mar 05, 2026
06 Ceph 运维——集群部署、PG 调优与故障处理
Ceph
运维
cephadm
PG调优
故障处理
监控
OSD
SRE
Mar 05, 2026
06 Doris 运维与调优——分区分桶设计、慢查询与扩缩容
Doris
运维
分区设计
分桶设计
慢查询
扩缩容
Compaction
监控
SRE
Mar 05, 2026
06 etcd 运维——集群管理、备份恢复与性能调优
etcd
运维
备份恢复
性能调优
集群管理
Kubernetes
SRE
监控
Mar 04, 2026
08 ES 生产运维——监控、容量规划与版本升级
Elasticsearch
运维
监控
容量规划
版本升级
ILM
告警
SRE
Mar 04, 2026
05 生产运维——部署、监控与故障处理
ZooKeeper
运维
部署
监控
故障处理
SRE
性能调优