如何使用青云的监控告警功能?
-
监控告警功能是基于资源层面的监控数据,设置告警条件和通知列表,
有助于及时了解资源使用情况和处理突发事件。目前支持的监控项包括:
主机
-
CPU:CPU 使用百分比
-
内存:内存使用百分比
-
磁盘使用率:磁盘空间使用百分比,检查范围包括主机中所有已挂载(mount)的分区
-
内网进流量:主机网卡的进流量,检查范围包括主机所有网卡
-
内网出流量:主机网卡的出流量,检查范围包括主机所有网卡
warning
其中内存和磁盘使用率监控暂不支持 Windows 和 CentOS 5.8
公网IP
- 公网进流量:从公网 IP 进来的流量
- 公网出流量:从公网 IP 出去的流量
路由器
- 内网进流量:路由器所连网络的进流量,检查范围包括所有与此路由器连接的私有网络
- 内网出流量:路由器所连网络的出流量,检查范围包括所有与此路由器连接的私有网络
负载均衡器
- 监听器 HTTP/HTTPS 协议
- 请求数:接收到的请求数
- 平均响应延迟时间:监听器下所有后端的响应时间
- 平均并发数:并发连接数
- 后端1xx/2xx/3xx/4xx/5xx响应数:监听器下所有后端返回的,对应状态码的响应数
- 监听器 TCP 协议
- 连接数:监听器下所有后端的 TCP 连接数
- 平均并发数:并发连接数
- 后端服务 HTTP 协议
- 平均响应延迟时间:监听器下所有后端的响应时间
- 后端1xx/2xx/3xx/4xx/5xx响应数:此后端返回的,对应状态码的响应数
- 后端服务 TCP 协议
- 连接数:此后端的 TCP 连接数
关系型数据库
关系型数据库的监控告警只会监控 “主节点” ,包括如下监控项:
- CPU:CPU 使用百分比
- 内存:内存使用百分比
- 磁盘使用率:磁盘空间使用百分比
- 活跃连接数:数据库的活跃连接数
- 查询请求:数据库执行的所有查询请求的次数
- 慢查询:根据数据库配置的慢查询标准,监控慢查询的次数
- 全表扫描次数:发生全表扫描的次数。
(全表扫描是数据库服务器用来搜寻表的每一条记录的过程, 直到所有符合给定条件的记录返回为止,大多发生在对无索引的表进行查询)
创建告警策略
首先我们需要创建一个告警策略,指定资源类型、检查周期、告警条件、通知列表等信息。
之后便可将其与资源关联,开始监控。下面以主机监控告警为例,介绍创建的步骤。在控制台导航中点击『监控告警』进入告警页面,然后点击『创建』按钮开始创建。
参数设置
参数设置可输入名称,资源类型和监控周期。
其中资源类型决定了这个告警策略可支持哪些监控项,不同的资源支持不同的
监控项 <support_meters> ,
在指定了资源类型后,这个告警策略只能关联同类型资源。
此例中我们选『主机』。监控周期则表示检查频率,会直接影响价格。
note
告警策略只有在绑定监控资源后才会计费: 总价=单价 x 资源个数告警规则
这一步可对资源支持的监控项设置多条告警规则,任何一条满足条件都会触发告警。
note
监控数据采样间隔都是1分钟,所以在设置阈值时,可能需要考虑这个时间因素。告警行为
最后一步作为可选项,可设置发送通知到
通知列表 <guide-notificationlist> ,
在资源的告警状态发生变化时收到通知。目前告警行为仅支持发送通知,以后还会支持更多操作。
到此告警策略便创建完成了,如果之后需要修改或调整,都可在告警策略详情页中操作。
需要注意的是,告警策略一旦创建完成,其『资源类型』属性便不可改变了。
如果需要其他资源类型的告警,请另行创建相应的策略。添加监控资源
告警策略创建完成后,便可给它添加监控资源。如下图所示,在告警策略详情页的基本属性菜单中点击
『添加监控资源』,之后在弹窗中选择要监控的资源即可。添加监控资源后,监控服务便会自动对资源开始监控。
如果资源被删除,其所关联的监控告警也会随之解除。查看告警历史
资源监控过程中的重要事件都会记录在告警历史中。告警历史可在资源详情页中看到,历史记录包括:
- 当修改了告警策略,并应用修改后,历史中会有一条配置变化的记录。
- 当资源监控状态发生变化时,会有相应的记录,
- 当执行告警事件时,也会有相应的记录,
监控告警有三个状态:正常,告警,监控数据不足。其中监控数据不足是指没有取到监控数据,
这通常是因为资源已关闭,或公网 IP 已解绑导致。负载均衡器监听器或后端服务的告警历史的查看需要鼠标点击『操作』或者右键某个后端服务,再选『监控告警』。
如图所示:监控历史会保留最近 50 条记录,更早的记录会定期删除。
-