- 【仪表盘】
- 全局状态概览
- 当前异常信息展示
- 各模块状态展示
- 【主机管理】
- 主机纳管(添加、导入、编辑、维护、删除)
- 主机自动监控、告警
- 【应用商店】
- 组件、应用WEB发布、服务端自动发现
- 组件、应用部署,自动编排解决依赖
- 【服务管理】
- 服务管理(启动、停止、重启、删除)
- 服务监控(监控、日志、告警、自愈)
- 【应用监控】
- 实时展示处于异常的主机、服务信息,呼应仪表盘的异常清单
- 告警历史记录查看,未读提醒,按添加检索
- 支持监控组件地址自定义,便于对接现有监控平台
- 【状态巡检】
- 支持主机巡检、组件巡检、深度分析,且支持导出
- 支持定时自动执行巡检任务
- 【系统管理】
- 用户账户管理
- 支持全局维护模式,避免人为操作时误报
-
【应用商店】
- 组件、应用服务的升级及回滚
- 应用服务的增量安装
-
【部署模板】
- 支持通过部署模版实现批量部署
-
【应用监控】
- 支持告警邮件配置,将告警信息发送至指定邮箱
-
【故障自愈】
- 展示故障自愈记录
- 支持监控到服务状态异常后自动进行重启
- 支持设置服务自愈尝试次数
-
【指标中心】
- 支持添加自定义告警指标规则
- 添加自定义扩展采集指标
-
【数据备份】
- 支持mysql、arangodb、postgreSql数据备份
- 备份记录展示、下载、删除
- 支持自定义保存路径、定时备份策略及邮件推送备份内容
-
【实用工具】
- 内置部分运维实用小工具
- 展示小工具执行过程、输出展示及生成文件下载
-
【系统管理】
- 增加邮件管理,支持设置smtp邮件服务器作为全局邮件发件箱
-
【平台优化】
- 优化主机纳管逻辑,增加纳管成功率,支持删除主机
- 优化应用安装服务逻辑代码
- 优化巡检逻辑
- 优化部分前端页面显示及交互效果
-
【其他】
- 修复已知bug
- 升级内置基础组件和环境
- alertmanager 升级至 v0.24.0
- tengine 升级至 v1.22.0
- 扩充内置环境中部分第三方库
- 升级主机 Agent & 监控 Agent
- 优化小工具异步任务执行逻辑
- 更新 prometheus 和 loki 的配置
- 修复 grafana 面板中 mysql 显示异常问题
- 补充应用商店基础组件包:mysq、elasticsearch
- 组件包从代码库抽离,减少源码 & 包体量
- 完善 OMP 管理脚本功能
- 支持升级、回滚,支持断点重试
- 支持命令行卸载应用商店已发布服务
- 内置 Redis 5.0.37 升级至 6.2.7
- 验证码登陆
- 修改密码长度异常问题
- 新增监控功能
- 产品http请求 5XX 错误
- jvm 文件句柄使用率过高
- 修复部分服务无法获取 cpu、内存问题
- 增加只读用户功能
- 修复添加主机提示已经存在问题
- 银河麒麟V10 ARM ,鲲鹏920 (ARM架构)2023.03.30
- 内置Grafana版本升级至 9.3.8
- 主机/服务详情页面布局调整
- 主机/服务/安装/升级/回滚页面中文本溢出处理
- 支持通过前端界面方式卸载应用商店中已经发布的应用
- 更新readme文档
- 新增功能【服务纳管】模块
- 重构【服务自愈】模块
- 新增 OOM 告警
- 更新部分 Grafana 面板
- 服务面板: redis、victoriametrics、rocketmq
- 集群面板: redis、clickhouse、mysql、tengine
- 修复 Grafana 无法登陆问题
- 重构「数据备份」模块
- 支持多端口服务监控 & 更新文档
- 前端优化,步骤类交互型界面,刷新自动跳转
- 前端优化,消除部分冗余导入
- 修复bug:仪表盘异常清单类型缺失,环形统计图跳转增加类型过滤,nodeExporter、loki启动失败问题