Files

Super User 72a5bf30b4 feat: 天地图瓦片缓存(tile-cache)、拓扑标注助手与文档更新

- tile-cache: 瓦片缓存服务(vec/cva)、启动探针、详细日志、上游超时可配置(UPSTREAM_TIMEOUT_MS)
- central: docker-compose 集成 tile-cache，env.example 增加 TILE_CACHE_* / TIANDITU_TK
- topology-editor: 天地图/缓存加载、GPS 安全来源错误提示、TIANDITU 文档(403/白名单、localhost 测试说明)
- doc: README 部署步骤与 GPS 安全来源说明，TIANDITU_CONFIG 完善

Co-authored-by: Cursor <cursoragent@cursor.com>

2026-02-25 11:11:38 -05:00

2.2 KiB

Raw Blame History

告警与通知

本文说明告警规则、如何激活，以及 Alertmanager 的配置与通知渠道。

告警规则（alert_rules.yml）

中央已内置 central-server/alert_rules.yml，主要包含：

规则	条件	说明
ONVIFDeviceDown	`up{job="onvif-devices"} == 0` 持续 1m	ONVIF 设备离线
NetworkDeviceDown	`probe_success{job="network-ping"} == 0` 持续 2m	网络设备 Ping 不通
HighNetworkLatency	`probe_duration_seconds{job="network-ping"} > 1` 持续 5m	Ping 延迟过高

为何显示 Inactive：规则依赖边缘推送的指标。需先部署边缘、配置 Ping/ONVIF 目标，数据经 remote_write 到 VictoriaMetrics 后，规则才会评估；无数据时保持 inactive。

激活步骤：完成 README.md#第二步边缘部署 → 在 Grafana 选 VictoriaMetrics 数据源确认有 probe_success{job="network-ping"} 等 → Prometheus 会从 VictoriaMetrics 取数并评估规则。

Alertmanager 配置（alertmanager.yml）

路径：central-server/alertmanager/alertmanager.yml。

route：分组（group_by）、等待时间（group_wait）、重复间隔（repeat_interval）、默认接收器（receiver）。
receivers：当前示例为 webhook http://127.0.0.1:5001/。
注意：容器内 127.0.0.1 指向自身，若 webhook 在宿主机，应改为 http://host.docker.internal:5001/ 或宿主机 IP。
inhibit_rules：critical 抑制同实例的 warning，减少告警风暴。

常用接收器类型：email_configs、wechat_configs、dingtalk_configs、webhook_configs。按需替换为邮件、企业微信、钉钉或自建 webhook。

验证：docker exec alertmanager amtool check-config /etc/alertmanager/alertmanager.yml；Web UI：http://localhost:9093。

自定义告警规则

在 alert_rules.yml 中追加或修改规则，例如：

- alert: ExampleAlert
  expr: your_metric > threshold
  for: 5m
  labels:
    severity: warning
  annotations:
    summary: "示例告警"

修改后若 Prometheus 启用了 --web.enable-lifecycle，可 curl -X POST http://localhost:9091/-/reload 重载。

2.2 KiB Raw Blame History Unescape Escape

告警与通知

告警规则（alert_rules.yml）

Alertmanager 配置（alertmanager.yml）

自定义告警规则

2.2 KiB

Raw Blame History