跳到主要内容

版本说明

v1.4.0

即将发布

🚀 新增功能

  • 内置告警子系统:全新原生告警能力,替代原 Grafana 告警界面
    • 七类监控:基础资源(含自定义 PromQL)、端口连通性、SSL 证书、Kafka 堆积、Kafka 重平衡、MongoDB、MySQL
    • 内置降噪:预警(Pending)→ 告警(Firing)→ 恢复(Recovered)状态机,状态变化才通知,不重复轰炸
    • 多渠道通知:飞书 / 钉钉 / 企业微信群机器人、邮件(SMTP 界面配置)、自定义 Webhook
    • 全局告警历史:可按来源类型、状态、时间范围筛选追溯
  • 统一数据源管理:新增顶级「数据源」页面,集中管理 Kafka / MongoDB / MySQL / Redis / Elasticsearch 等监控目标(支持多实例),左侧菜单按已启用数据源动态显示
    • 支持「测试连接」真实鉴权验证;凭据 AES 加密存储
    • 可选 http 服务发现模式:在界面添加数据源后自动拉起 exporter 并注册 Prometheus 抓取,无需修改环境变量重启
  • MongoDB 慢查询支持集群分片:多个启用诊断的 MongoDB 实例自动聚合分析

🏗️ 架构变更

  • 单镜像交付:所有组件合并为单一镜像 ops-allinone,通过 ROLE 环境变量区分角色。只需拉取 / 离线导入一个镜像,升级与交付大幅简化
  • 告警数据独立存储:新增 ops-mongo 容器存放告警规则 / 状态 / 历史 / 渠道 / 数据源,与被监控业务数据库完全解耦

⚠️ 升级注意

  • ops.yaml 结构有较大调整(单镜像 + ROLE),请参考最新部署文档重新生成配置
  • 新增必配环境变量:ENV_ALERT_CRYPTO_KEY(凭据加密密钥)
  • 原 Grafana 告警 / 通知 / 静默界面已移除,告警配置需在新版「告警管理」中重新创建

v1.3.0

已发布(2026-06-03)

🚀 新增功能

  • Kubernetes 集群监控:支持监控 K8s 集群的节点、容器、Pod 与集群对象状态
    • static 模式:运维平台部署在集群外,远程抓取集群暴露的指标端点
    • incluster 模式:Prometheus 作为 Pod 运行在被监控集群内,自动发现 kubelet / cAdvisor / kube-state-metrics
    • 新增 K8s 集群监控仪表盘与「资源监控 → K8s」菜单
  • 中间件多实例监控:单个 agent 支持同时监控多个同类型中间件实例
  • 日志保留策略:Loki 启用数据保留(默认 30 天)与删除 API

v1.2.5

已发布(2026-05-13)

🚀 新增功能

  • 日志查询体验升级:原"日志查询"统一面板拆分为两个独立面板,分工更清晰:
    • 容器控制台:按容器查看 Docker 进程输出(适合排查 MySQL、Redis、Kafka 等中间件容器)
    • 服务日志:按 HAP 微服务查看结构化业务日志,自动展开请求参数、堆栈、调用方法、耗时等业务字段
  • 服务日志全文搜索:新增搜索框,可一次查到日志正文 + 业务参数(如手机号、订单号、用户 ID、traceID 等)
  • 过滤器多选:容器 / 服务 / 级别过滤器全部支持多选

🔧 问题修复

  • 修复 Kafka 监控面板加载失败的问题
  • 修复部分中间件监控面板的数据展示问题

📖 文档

  • 新增「日志查询使用指南」介绍两个日志面板的用途、典型查询场景、进阶 LogQL 用法
  • 新增「部署常见问题」FAQ
  • 补充「MongoDB 慢查询」使用说明和 profiler 启用方法
  • 修正 Node Exporter 部署文档:单机/集群内已内置,仅监控集群外服务器时才需独立安装
  • 部署资源要求从 2C/4G 修正为 4C/8G

v1.2.0

已发布(2026-04-01)

🚀 新增功能

  • 日志查看:支持结构化日志实时检索,统一查看应用、容器和系统日志
  • 应用性能监控(APM):支持分布式链路追踪,可视化呈现请求跨多个微服务的调用链与耗时
  • 统一可观测性界面:在同一界面整合指标、日志、链路三类数据
  • 子路径部署:支持通过反向代理挂载到任意子路径(如 /mdis),方便对接已有门户

v1.1.0

已发布(2025-03-05)

🚀 新增功能

  • 支持查看 MongoDB 数据库慢查询及索引建议
  • 支持配置告警

v1.0.0

已发布(2025-01-02)

🎯 初始版本

  • 支持系统资源监控