基本框架

This commit is contained in:
2026-03-21 04:36:06 +08:00
commit de1be1dbe5
125 changed files with 10302 additions and 0 deletions

View File

@@ -0,0 +1,57 @@
# 04-06-nodejs-探针与健康检查
> 为 `nodejs-demo` 配置 **存活 / 就绪 / 启动** 探针,使 kubelet 能在异常时重启容器,并在未就绪时从 Service **Endpoints** 摘除流量。
## 前置条件
- 已部署 `nodejs-demo``04-01`);应用需暴露可探测的 HTTP 路径(示例用根路径 `/`)。
## 清单路径(唯一真源)
| 本篇完整清单 | [`ansible/files/nodejs-demo/04-06-nodejs-demo.yaml`](../ansible/files/nodejs-demo/04-06-nodejs-demo.yaml) |
| 应用 | `kubectl apply -f ansible/files/nodejs-demo/04-06-nodejs-demo.yaml` |
探针端口与累积清单一致,为 **8080**(自 `04-04` 起)。
## 场景说明(白话)
Kubernetes 会**周期性访问**你指定的地址,判断容器该不该重启、该不该接流量:
| 探针 | 人话 |
|------|------|
| **存活 liveness** | 「还活着吗?」一直失败就**重启容器**(认为卡死)。 |
| **就绪 readiness** | 「能接客了吗?」失败时**不放进 Service 负载均衡**(流量不打进来)。 |
| **启动 startup** | 「是不是还在慢启动?」启动阶段先由它把关,避免被 liveness **误杀**。 |
### 相对 `04-05` 的变更(原文 → 新文)
| 位置 | 原文(`04-05` | 新文(`04-06` |
|------|-----------------|-----------------|
| `livenessProbe` / `readinessProbe` | (无) | `httpGet` 路径 `/`,端口 **8080**`initialDelaySeconds`/`periodSeconds` 见清单文件 |
生产建议为健康检查单独提供 `/health``/ready` 路径(与业务路由分离)。
## 部署与验证
```bash
kubectl apply -f ansible/files/nodejs-demo/04-06-nodejs-demo.yaml
kubectl describe pod -l app=nodejs-demo -n default | sed -n '/Liveness/,/Events/p'
kubectl get endpoints nodejs-demo -n default
```
故意让应用崩溃或阻塞时,观察 **重启次数****Ready** 条件变化。
## TCP 探针(备选)
**YAML 怎么接**:与 HTTP 探针二选一;仍在 **Deployment 容器**里把 `httpGet` 换成 `tcpSocket: { port: 3000 }` 即可。适合「没有 HTTP、但端口能连上就算活着」的服务。
## 失败排查
- **CrashLoopBackOff**`livenessProbe` 过严或 `initialDelaySeconds` 过短;先放宽或加 `startupProbe`
- **Service 无流量但 Pod Running**readiness 失败;`kubectl get ep` 为空地址。
- `06-01-k3s-networkpolicy-故障排查.md`
## 相关文档
- [`04-04-nodejs-端口与Service.md`](04-04-nodejs-端口与Service.md)
- [`04-11-nodejs-副本与滚动发布.md`](04-11-nodejs-副本与滚动发布.md)