日常更新

This commit is contained in:
2026-03-29 09:08:01 +08:00
parent 31709425e2
commit befdefd222
224 changed files with 7240 additions and 3297 deletions

View File

@@ -5,7 +5,7 @@
## TL;DR
- **自动化验收**`./scripts/verify.sh run 03-07`
- **自动化验收**`./ansible/bin/verify.sh run 03-07`
- **关键前置**:按本文「前置条件」准备环境变量/Secret/入口 IP
- **成功判据**:达到本文「预期」且 playbook 断言通过
- **排障**:见本文「排障」
@@ -18,7 +18,7 @@ Longhorn 与 K3s 的 `containerd`/镜像、local-path 都会大量占用 **`k3s_
- **请先阅读**[`00-02-部署环境说明.md`](00-02-部署环境说明.md)(四节点统一拓扑、自检命令、推荐 playbook 顺序)。
- **自检**(每台节点):`mountpoint -q /storage && findmnt -n -o SOURCE /``findmnt -n -o SOURCE /storage` 输出须**不同**。
- **Ansible**`01-06.yml -e k3s_do_install=true``k3s_verify_storage_mount: true``group_vars/all.yml` 默认)时会在安装前校验上述条件;可选先跑 `01-06.yml -e k3s_do_prepare_storage=true -e k3s_prepare_storage=true` 准备第二块盘,见 `01-06-节点初始化-ansible-实践.md`
- **Ansible**`01-05.yml -e k3s_do_install=true``k3s_verify_storage_mount: true``group_vars/all.yml` 默认)时会在安装前校验上述条件;可选先跑 `01-05.yml -e k3s_do_prepare_storage=true -e k3s_prepare_storage=true` 准备第二块盘,见 `01-05-节点初始化-ansible-实践.md`
- Longhorn 数据目录建议为 **`/storage/longhorn`**(与 Helm `values-lab.yaml` 一致),勿与系统盘混用。
**容量与副本数**:每节点数据盘约 **32G** 时,`defaultReplicaCount`**2 或 3** 会使同一份逻辑卷在集群内占用 **多倍物理空间**(各副本落在不同节点上各占一份),且 Longhorn 元数据与系统组件仍有开销;实验环境可先用副本 **1**,要演练跨节点冗余再调高并预留磁盘。
@@ -115,7 +115,7 @@ kubectl get pod -n longhorn-system -o wide
### SSH 配置说明(本机能否直连「各节点」)
- **`ylc61`(控制节点)**:常见做法是在本机 `~/.ssh/config` 里配置 `Host ylc61``IdentityFile` 指向**该节点专用私钥**(例如仓库内 `.ssh/id_ed25519_k3s_192.168.2.61`,与 `01-06` / 建链脚本一致)。配好后可 **`ssh ylc61`**,并在其上执行 **`kubectl`**(设好 `KUBECONFIG`**不必**强求本机安装 kubectl 或直连 API Server。
- **`ylc61`(控制节点)**:常见做法是在本机 `~/.ssh/config` 里配置 `Host ylc61``IdentityFile` 指向**该节点专用私钥**(例如仓库内 `.ssh/id_ed25519_k3s_192.168.2.61`,与 `01-05` / 建链脚本一致)。配好后可 **`ssh ylc61`**,并在其上执行 **`kubectl`**(设好 `KUBECONFIG`**不必**强求本机安装 kubectl 或直连 API Server。
- **`ylc62``ylc64`(工作节点)**`ansible/inventory.ini` 里为**每台**配置了**不同**的 `ansible_ssh_private_key_file`(如 `~/.ssh/id_ed25519_k3s_192.168.2.62` …)。若本机 `~/.ssh/config` **没有**对应 `Host ylc62` …,则 **`ssh ylc62``Permission denied`**(用错成控制节点密钥时尤其常见)。需要本机循环 SSH 四台时,请为 **6264** 各写一段 `Host``IdentityFile` 与清单路径一致。
- **只做 Longhorn 安装与排查时**:多数步骤只需 **`ssh ylc61` + `kubectl`**;只有要到**具体工作节点**执行 **`ctr` 预拉镜像**、看 **kubelet/containerd** 时,才必须能登录该节点(直连、串口、或 Ansible `-l ylc63` 等均可)。
@@ -160,7 +160,7 @@ done
**首选Helm + 本仓库 `values-lab.yaml`**(与 K3s 常见实践一致,版本与实验室变量集中在 `ansible/group_vars/all.yml``longhorn_chart_version`)。
- **Ansible推荐**:在控制机执行(与 `01-06` 顺序一致):
- **Ansible推荐**:在控制机执行(与 `01-05` 顺序一致):
```bash
cd ansible