汀的知识碎片

Tag: SRE

9 items with this tag.

  • Apr 13, 2026

    00 专栏导览:大数据集群 SRE 的 AiOps 工程实践

    • AiOps
    • SRE
    • 大数据
    • 智能运维
    • 专栏导览
  • Apr 13, 2026

    01 AiOps 是什么:从救火到防火的运维范式革命

    • AiOps
    • SRE
    • 智能运维
    • 运维范式
    • DevOps
  • Apr 13, 2026

    10 AiOps 闭环:从感知到自愈的完整链路设计

    • AiOps
    • 闭环
    • 自愈
    • 预测性运维
    • 成熟度模型
    • SRE
    • 大数据
  • Mar 24, 2026

    NameNode 崩溃复盘:HDFS QJM 写超时与 KDC UDP 丢包根因分析(2026-03-20)

    • HDFS
    • Kerberos
    • NameNode
    • QJM
    • 故障复盘
    • SRE
  • Mar 05, 2026

    06 Ceph 运维——集群部署、PG 调优与故障处理

    • Ceph
    • 运维
    • cephadm
    • PG调优
    • 故障处理
    • 监控
    • OSD
    • SRE
  • Mar 05, 2026

    06 Doris 运维与调优——分区分桶设计、慢查询与扩缩容

    • Doris
    • 运维
    • 分区设计
    • 分桶设计
    • 慢查询
    • 扩缩容
    • Compaction
    • 监控
    • SRE
  • Mar 05, 2026

    06 etcd 运维——集群管理、备份恢复与性能调优

    • etcd
    • 运维
    • 备份恢复
    • 性能调优
    • 集群管理
    • Kubernetes
    • SRE
    • 监控
  • Mar 04, 2026

    08 ES 生产运维——监控、容量规划与版本升级

    • Elasticsearch
    • 运维
    • 监控
    • 容量规划
    • 版本升级
    • ILM
    • 告警
    • SRE
  • Mar 04, 2026

    05 生产运维——部署、监控与故障处理

    • ZooKeeper
    • 运维
    • 部署
    • 监控
    • 故障处理
    • SRE
    • 性能调优

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community