Kubernetes 生命周期管理与服务发现专栏导览

专栏定位

前三个专栏解决了 K8s “是什么”(架构与对象)、“谁来守门”(API Server)、“谁来驱动”(控制器与调度器)。本专栏聚焦运行态——一个 Pod 从被调度到节点之后,到底经历了怎样的生命周期?kubelet 如何拉取镜像、创建容器、执行健康检查?Pod 终止时如何实现优雅停机?多个 Pod 组成的服务如何被发现和访问(Service / DNS / Ingress)?

这些是每一个 K8s 用户在日常工作中直接面对的问题:为什么 Pod 一直 CrashLoopBackOff?为什么滚动更新期间会出现 502?为什么 Service 的负载均衡不均匀?本专栏从底层原理层面回答这些问题。

前置知识容器核心原理专栏(容器网络、Namespace)+ 架构原则与对象设计专栏(Pod 设计、Label/Selector)。

目录

序号文章核心内容
0101 kubelet 与 Pod 的创建流程kubelet 的架构(PLEG / PodWorker / CRI 接口)、Pod 从调度到运行的完整链路(SyncPod 流程)、容器运行时接口(CRI)与 containerd 的交互、Pod Sandbox(pause 容器)的创建
0202 Pod 生命周期深度解析Pod Phase(Pending/Running/Succeeded/Failed/Unknown)、容器状态(Waiting/Running/Terminated)、Init Container 的执行语义、postStart / preStop Hook、restartPolicy 的三种策略
0303 健康检查与就绪探针Liveness / Readiness / Startup Probe 的语义差异、探针的三种实现(HTTP / TCP / Exec)、探针参数调优(initialDelaySeconds / periodSeconds / failureThreshold)、探针配置不当导致的生产事故分析
0404 优雅停机与滚动更新的零停机SIGTERM 信号传递链、preStop Hook 的执行时序、terminationGracePeriodSeconds、Endpoint 摘除与流量排空的竞态问题、滚动更新期间零停机的完整方案(readinessGate / preStop sleep)
0505 Service 与 kube-proxy 原理Service 的 ClusterIP / NodePort / LoadBalancer / ExternalName 四种类型、Endpoints 与 EndpointSlice、kube-proxy 的三种模式(iptables / IPVS / nftables)、Service 的负载均衡算法、Headless Service
0606 DNS 服务发现与 IngressCoreDNS 的工作原理、Service DNS 记录(A/SRV)、Pod DNS 策略(ClusterFirst / Default)、Ingress 的设计模型(Ingress Controller / IngressClass)、Ingress 到 Gateway API 的演进

推荐阅读路径

  • Pod 排障必备:01 → 02 → 03(理解 Pod 为什么不正常)
  • 零停机发布:03 → 04(探针 + 优雅停机的配合)
  • 服务访问链路:05 → 06(流量从外部到 Pod 的完整路径)

关联专栏

  • K8s 网络:Service/kube-proxy/CNI 的底层网络原理
  • 服务网格:Istio VirtualService 与 K8s Service 的关系
  • Docker:容器生命周期的底层基础
  • 指标体系:Pod 探针与 Prometheus 监控的配合