项目概览
快速部署
Docker 一键部署,1分钟即可启动完整的告警管理平台
AI 智能分析
集成 AI 技术,智能分析告警内容,提供解决建议
多平台集成
支持 Zabbix、Prometheus、Grafana 等主流监控平台
多渠道通知
支持企业微信、钉钉、飞书等多种通知方式
核心功能
告警接收
支持 Prometheus Webhook 和 Zabbix 脚本集成,实现多源告警统一接收和状态追踪。
消息推送
支持企业微信、钉钉、飞书等多种通知渠道,确保告警信息及时送达相关人员。
数据管理
提供实时告警看板、历史查询、日志导出和统计分析等完整的数据管理功能。
监控大屏
集成 Grafana 面板,支持目录树管理和面板分类组织,实现一站式监控查看。
AI辅助
集成AI智能分析功能,为告警提供问题诊断建议和解决方案,提升运维效率。
用户管理
支持用户注册登录、权限分级管理,确保系统安全性和功能的合理分配。
发版日志
正式版
v1.0
2025年6月21日
首次正式发布
开发中
v1.1
敬请期待
部署教程
Docker 一键部署
# 创建数据卷
docker volume create alertfusion-db
# 运行容器
docker run -d -p 10085:10085 \
-v /etc/localtime:/etc/localtime:ro \
-v /etc/timezone:/etc/timezone:ro \
--name AlertFusion \
-v alertfusion-db:/var/lib/mysql \
--privileged=true --restart=always \
registry.cn-chengdu.aliyuncs.com/pzl_devops/alertfusion_private:latest
部署说明:AI功能及消息发送需依赖互联网,容器启动后,访问 http://your-server-ip:10085 即可使用。
在线演示
使用教程
详细的集成教程,快速对接各种监控系统,实现统一告警管理
集成流程
1
部署 AlertFusion
使用 Docker 快速部署告警平台
2
配置监控系统
根据教程配置 Zabbix/Prometheus
3
测试告警推送
验证告警是否正常接收
4
完成对接
开始使用AlertFusion
拓展学习
深入学习监控技术,掌握 Zabbix、Prometheus 和 Grafana 的核心技能
官方文档
监控系统对比
特性 | Zabbix | Prometheus | Grafana |
---|---|---|---|
数据存储 | 关系型数据库(MySQL/PostgreSQL) | 时间序列数据库(TSDB) | 支持多种数据源 |
数据采集 | Agent、SNMP、JMX | Pull 模式,Exporter | 通过数据源插件 |
告警机制 | 内置告警系统 | Alertmanager | 告警规则和通知 |
可视化 | 内置图表和仪表板 | 基础 Web UI | 强大的可视化功能 |
学习难度 | 中等 | 较高 | 较低 |
Zabbix 深度学习
企业级监控解决方案,适合大规模基础设施监控
学习路径
1. 基础概念与架构
2. 安装与配置
3. 监控项与触发器
4. 模板与宏
5. 告警与通知
6. 高级功能与优化
核心知识点
- 架构组件:Server、Agent、Proxy、Web界面
- 数据采集:主动检查、被动检查、SNMP
- 监控对象:主机、应用、服务、网络设备
- 数据处理:预处理、计算项、聚合
- 可视化:图形、屏幕、地图、仪表板
最佳实践
- 合理规划主机组和模板结构
- 使用宏提高配置的可维护性
- 设置合理的数据保留策略
- 定期备份配置和数据库
- 监控 Zabbix 自身的性能
- 优化数据库性能和索引
- 使用 Zabbix Proxy 分布式部署
- 配置合理的告警升级策略
高级功能
- 自动发现:网络设备、文件系统、数据库
- 低级发现:动态监控项创建
- Web监控:HTTP场景监控
- IPMI监控:硬件健康状态
- VMware监控:虚拟化环境监控
Prometheus 深度学习
云原生监控系统,专为微服务和容器环境设计
学习路径
1. 时间序列数据库概念
2. Prometheus 架构
3. 指标类型与标签
4. PromQL 查询语言
5. Exporter 开发
6. 告警规则与 Alertmanager
核心知识点
- 数据模型:指标名称、标签、时间戳、值
- 指标类型:Counter、Gauge、Histogram、Summary
- 服务发现:静态配置、DNS、Kubernetes、Consul
- 存储引擎:本地存储、远程存储
- 联邦集群:分层监控、跨集群查询
最佳实践
- 合理设计指标命名和标签
- 避免高基数标签
- 使用 recording rules 优化查询
- 配置合适的数据保留策略
- 监控 Prometheus 自身指标
- 使用联邦集群实现高可用
- 配置远程存储解决方案
- 优化抓取间隔和超时设置
生态系统
- Alertmanager:告警路由和通知管理
- Pushgateway:短期任务指标推送
- Node Exporter:系统指标采集
- Blackbox Exporter:黑盒监控
- cAdvisor:容器指标监控
Grafana 深度学习
强大的可视化平台,支持多种数据源和丰富的图表类型
学习路径
1. 基础概念与安装
2. 数据源配置
3. 仪表板设计
4. 面板类型与配置
5. 变量与模板
6. 告警与通知
核心知识点
- 数据源:Prometheus、InfluxDB、Elasticsearch
- 面板类型:Graph、Stat、Table、Heatmap
- 变量系统:Query、Custom、Constant、Datasource
- 模板功能:重复面板、动态仪表板
- 权限管理:组织、团队、用户角色
最佳实践
- 设计清晰的仪表板层次结构
- 使用变量提高仪表板复用性
- 合理设置刷新间隔
- 优化查询性能
- 建立仪表板版本管理
- 配置用户权限和团队管理
- 使用注解标记重要事件
- 设置合理的告警通知策略
插件生态
- 数据源插件:InfluxDB、Elasticsearch、MySQL
- 面板插件:Worldmap、Pie Chart、Heatmap
- 应用插件:Kubernetes、Docker、AWS
- 自定义插件:开发企业专用插件
- 社区插件:丰富的第三方扩展
赞助支持
支持项目发展
如果 AlertFusion 对您的工作有帮助,欢迎通过以下方式支持项目发展!
微信扫码赞赏
支付宝扫码赞赏
其他支持方式
给项目点星
在代码托管平台给项目点赞支持
分享推荐
向朋友和同事推荐这个项目
反馈建议
提交问题反馈和功能建议
如果这个项目对您有帮助,请给我一个赞!您的支持是我持续改进的动力。
0
人觉得这个项目很棒
感谢支持!您的每一份支持都是我们持续改进和发展的动力。