监控告警功能是基于资源层面的监控数据,设置告警条件和通知列表,
有助于及时了解资源使用情况和处理突发事件。

目前支持的监控项包括:

主机

CPU:CPU 使用百分比

内存:内存使用百分比

磁盘使用率:磁盘空间使用百分比,检查范围包括主机中所有已挂载(mount)的分区

内网进流量:主机网卡的进流量,检查范围包括主机所有网卡

内网出流量:主机网卡的出流量,检查范围包括主机所有网卡

warning
其中内存和磁盘使用率监控暂不支持 Windows 和 CentOS 5.8

公网IP

公网进流量:从公网 IP 进来的流量 公网出流量:从公网 IP 出去的流量

路由器

内网进流量:路由器所连网络的进流量,检查范围包括所有与此路由器连接的私有网络 内网出流量:路由器所连网络的出流量,检查范围包括所有与此路由器连接的私有网络

负载均衡器

监听器 HTTP/HTTPS 协议 请求数:接收到的请求数 平均响应延迟时间:监听器下所有后端的响应时间 平均并发数:并发连接数 后端1xx/2xx/3xx/4xx/5xx响应数:监听器下所有后端返回的,对应状态码的响应数 监听器 TCP 协议 连接数:监听器下所有后端的 TCP 连接数 平均并发数:并发连接数 后端服务 HTTP 协议 平均响应延迟时间:监听器下所有后端的响应时间 后端1xx/2xx/3xx/4xx/5xx响应数:此后端返回的,对应状态码的响应数 后端服务 TCP 协议 连接数:此后端的 TCP 连接数

关系型数据库

关系型数据库的监控告警只会监控 “主节点” ,包括如下监控项:

CPU:CPU 使用百分比 内存:内存使用百分比 磁盘使用率:磁盘空间使用百分比 活跃连接数:数据库的活跃连接数 查询请求:数据库执行的所有查询请求的次数 慢查询:根据数据库配置的慢查询标准,监控慢查询的次数 全表扫描次数:发生全表扫描的次数。
(全表扫描是数据库服务器用来搜寻表的每一条记录的过程, 直到所有符合给定条件的记录返回为止,大多发生在对无索引的表进行查询) 创建告警策略

首先我们需要创建一个告警策略,指定资源类型、检查周期、告警条件、通知列表等信息。
之后便可将其与资源关联,开始监控。下面以主机监控告警为例,介绍创建的步骤。

在控制台导航中点击『监控告警』进入告警页面,然后点击『创建』按钮开始创建。

参数设置

参数设置可输入名称,资源类型和监控周期。
其中资源类型决定了这个告警策略可支持哪些监控项,不同的资源支持不同的
监控项 <support_meters> ,
在指定了资源类型后,这个告警策略只能关联同类型资源。
此例中我们选『主机』。

监控周期则表示检查频率,会直接影响价格。

note
告警策略只有在绑定监控资源后才会计费: 总价=单价 x 资源个数

告警规则

这一步可对资源支持的监控项设置多条告警规则,任何一条满足条件都会触发告警。

note
监控数据采样间隔都是1分钟,所以在设置阈值时,可能需要考虑这个时间因素。

告警行为

最后一步作为可选项,可设置发送通知到
通知列表 <guide-notificationlist> ,
在资源的告警状态发生变化时收到通知。

目前告警行为仅支持发送通知,以后还会支持更多操作。

到此告警策略便创建完成了,如果之后需要修改或调整,都可在告警策略详情页中操作。
需要注意的是,告警策略一旦创建完成,其『资源类型』属性便不可改变了。
如果需要其他资源类型的告警,请另行创建相应的策略。

添加监控资源

告警策略创建完成后,便可给它添加监控资源。如下图所示,在告警策略详情页的基本属性菜单中点击
『添加监控资源』,之后在弹窗中选择要监控的资源即可。

添加监控资源后,监控服务便会自动对资源开始监控。
如果资源被删除,其所关联的监控告警也会随之解除。

查看告警历史

资源监控过程中的重要事件都会记录在告警历史中。告警历史可在资源详情页中看到,历史记录包括:

当修改了告警策略,并应用修改后,历史中会有一条配置变化的记录。 当资源监控状态发生变化时,会有相应的记录, 当执行告警事件时,也会有相应的记录,

监控告警有三个状态:正常,告警,监控数据不足。其中监控数据不足是指没有取到监控数据,
这通常是因为资源已关闭,或公网 IP 已解绑导致。

负载均衡器监听器或后端服务的告警历史的查看需要鼠标点击『操作』或者右键某个后端服务,再选『监控告警』。
如图所示:

监控历史会保留最近 50 条记录,更早的记录会定期删除。