Files
Distributed-Prometheus/doc/README.md
Super User 95a09fd9d8 完善中央与边缘部署、远程写入与监控文档
- 增加中央与边缘完整配置和部署脚本
- 引入 VictoriaMetrics 数据源与 remote_write 故障排查说明
- 新增 edge-agent 配置脚本、ONVIF 自建 exporter 与 ping 监控示例

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-25 04:24:40 -05:00

5.9 KiB
Raw Blame History

Distributed-Prometheus 文档

本目录为项目文档入口。先按部署顺序做完第一步、第二步,再按需查阅其他文档。


部署顺序(必读)

整体顺序:先中央,后边缘。边缘向中央主动上报数据,中央必须先就绪。

步骤 部署什么 做什么 验证
第一步 中央服务器 部署 Prometheus、Grafana、VictoriaMetrics、Alertmanager Grafana http://localhost:3000、Prometheus http://localhost:9091
第二步 边缘节点(可选,可多台) 配置中央地址与监控目标,部署边缘 Prometheus + Exporter 边缘 UI http://localhost:9092Grafana 选 VictoriaMetrics 数据源可见边缘数据
第三步 多用户 / 告警(可选) 配置 Grafana 组织与用户、Alertmanager 通知 USER_MANAGEMENT.mdALERTMANAGER_CONFIG.md 验证

第一步:部署中央服务器

必须先做。中央提供 VictoriaMetrics接收边缘数据、Prometheus、Grafana、Alertmanager。

cd central-server
cp env.example .env   # 可选按需改端口、Traefik、网络等
bash deploy.sh

第二步:部署边缘节点

在中央已运行后进行。边缘将指标推送到中央 VictoriaMetrics端口 8428
边缘必选:remote_writeprometheus-edgeBlackbox 容器可选ONVIF/SNMP 等容器(见 EDGE_AGENT_CONFIG.md)。

  • 本机同机(中央与边缘在同一台机器):

    cd edge-agent
    bash run-edge-local.sh
    

    脚本会设置中央地址为 host.docker.internal:8428 并执行部署。

  • 边缘在另一台机器

    cd edge-agent
    cp env.example .env
    # 编辑 .envCENTRAL_SERVER_HOST=中央服务器IPCENTRAL_SERVER_PORT=8428
    cd config && ./update-configs.sh && cd ..   # 从 targets.csv 生成 JSON
    bash deploy.sh
    
  • 验证:边缘 Prometheus UI http://localhost:9092端口 9092 避免与中央 9091 冲突)。在中央 Grafana 中选择数据源「VictoriaMetrics」,查询如 up{job="network-ping"} 可见边缘数据中央自身指标在数据源「Prometheus」。

  • 摄像头/ONVIF:默认不拉取 ONVIF 镜像(公共镜像不存在)。监控摄像头可选:SNMP ExporterFrigateBlackbox 探测 或自建 ONVIF 镜像,见 ONVIF_ALTERNATIVES.md

  • 监控目标:编辑 edge-agent/config/targets.csvPing / ONVIF详见 TARGETS_CSV_GUIDE.md

  • 详细EDGE_NODE_SETUP.mdEDGE_AGENT_CONFIG.mdDEPLOYMENT_GUIDE.md


第三步(可选):多用户与告警


文档列表(按用途)

架构与数据流

文档 说明
ARCHITECTURE.md 系统架构、容器关系、数据流向、端口与依赖

配置说明

文档 说明
CENTRAL_SERVER_CONFIG.md 中央服务器配置文件说明
../central-server/CONFIGURATION.md 中央服务器环境变量(.env说明
EDGE_AGENT_CONFIG.md 边缘节点配置文件说明
TARGETS_CSV_GUIDE.md 边缘监控目标 targets.csv 格式与示例
MONITORING_TARGETS.md ONVIF / 网络探测等监控目标说明
ONVIF_ALTERNATIVES.md 摄像头/ONVIF 监控替代方案SNMP、Frigate、Blackbox、自建

用户与告警

文档 说明
USER_MANAGEMENT.md Grafana 多用户、组织与数据隔离
ALERT_RULES_EXPLANATION.md 告警规则说明
ALERTMANAGER_CONFIG.md Alertmanager 配置与通知渠道

部署与运维

文档 说明
DEPLOYMENT_GUIDE.md 完整部署步骤、检查清单、验证与常见问题
EDGE_NODE_SETUP.md 边缘节点配置与验证(含本机同机)
TROUBLESHOOTING.md 故障排查
BEST_PRACTICES.md 最佳实践与生产环境建议

参考

文档 说明
PROJECT_DEFECTS.md 项目缺陷与修复建议

快速导航