日常更新

This commit is contained in:
2026-03-29 09:08:01 +08:00
parent 31709425e2
commit befdefd222
224 changed files with 7240 additions and 3297 deletions

View File

@@ -2,12 +2,17 @@
## TL;DR
- **自动化验收**:在控制端(如 `ylc65`)执行 `./scripts/verify.sh run 01-01`
- **自动化验收**:在控制端(如 `ylc65`)执行 `./ansible/bin/verify.sh run 01-01`
- **手工安装**:控制节点执行 `curl -sfL https://get.k3s.io | sh -s - server --data-dir=/storage`(或默认路径)
- **成功判据**node 为 `Ready``kube-system``coredns` / `traefik` Deployment 存在Traefik 入口可响应(常见为 `404`
- **失败排障**:见本文「排障」小节(事件/Pod/日志/磁盘压力)
> 说明:本篇聚焦 **单控制节点安装与基础验收**。若要一键自动化安装多节点集群,见 `01-06-节点初始化-ansible-实践.md`。
> 说明:本篇聚焦 **单控制节点安装与基础验收**。若要一键自动化安装多节点集群,见 `01-05-节点初始化-ansible-实践.md`。
## 契约与真源
- **安装命令备忘**`ansible/files/01-01/k3s-server-install.example.sh`(与下文 curl 片段一致;非 K8s 清单)。
- **自动**`./ansible/bin/verify.sh run 01-01`(专用 kubectl 断言;与手工安装共用 `ansible/files/01-01/` 索引)。
## 前置条件
@@ -25,7 +30,7 @@ K3s 默认将数据(含 local-path 卷)放在 `--data-dir` 下。系统盘
| **方案一(默认)** | `/var/lib/rancher/k3s` | 系统盘空间充足 |
| **方案二(数据盘)** | `/storage` | 系统盘小,数据盘单独挂载在 `/storage` |
> 自定义 `/storage` 仅解决单节点内系统盘/数据盘分离;节点或数据盘重建后数据不会自动迁移,高可用与备份见 `01-08`、`06-03`。
> 自定义 `/storage` 仅解决单节点内系统盘/数据盘分离;节点或数据盘重建后数据不会自动迁移,高可用与备份见 `01-07`、`06-03`。
## 操作步骤
@@ -47,7 +52,7 @@ curl -sfL https://get.k3s.io | sh -
curl -sfL https://get.k3s.io | sh -s - server --data-dir=/storage
```
- 使用方案二时token 路径为 `/storage/server/token`(供 01-02 工作节点加入与 01-08 HA 使用)。
- 使用方案二时token 路径为 `/storage/server/token`(供 01-02 工作节点加入与 01-07 HA 使用)。
## 配置 kubectl供当前用户使用
@@ -158,11 +163,11 @@ curl -I --max-time 3 http://127.0.0.1:80
## 清理
本篇为安装类文档:手工安装后一般 **不卸载 K3s**,而是继续后续实验。若你仅为排障临时验收,可在运行 `./scripts/verify.sh run 01-01` 时设 `VERIFY_TEARDOWN=0` 保留现场(本篇用例默认不做破坏性清理)。
本篇为安装类文档:手工安装后一般 **不卸载 K3s**,而是继续后续实验。若你仅为排障临时验收,可在运行 `./ansible/bin/verify.sh run 01-01` 时设 `VERIFY_TEARDOWN=0` 保留现场(本篇用例默认不做破坏性清理)。
## 排障
- **节点不 Ready / DiskPressure**:优先确认 `/storage` 为独立挂载点(见 `docs/00-04-部署环境说明.md`),再看 `df -h``kubectl describe node <name>` 事件。
- **节点不 Ready / DiskPressure**:优先确认 `/storage` 为独立挂载点(见 `docs/00-02-部署环境说明.md`),再看 `df -h``kubectl describe node <name>` 事件。
- **Traefik 不就绪**`kubectl -n kube-system get pods -o wide`;必要时 `kubectl -n kube-system logs deploy/traefik --tail=200`
- **CoreDNS 解析异常(影响后续 ACME**见下节「CoreDNS 上游 DNS」。
@@ -184,7 +189,7 @@ forward . 223.5.5.5 8.8.8.8
然后重启 CoreDNS`kubectl -n kube-system rollout restart deploy/coredns`
> 若使用 Ansible 一键安装(`01-06`playbook 已自动完成此配置,无需手动修改。
> 若使用 Ansible 一键安装(`01-05`playbook 已自动完成此配置,无需手动修改。
## 下一步