如何使用青云的监控告警功能?



  • 监控告警功能是基于资源层面的监控数据,设置告警条件和通知列表,
    有助于及时了解资源使用情况和处理突发事件。

    目前支持的监控项包括:

    主机

    • CPU:CPU 使用百分比

    • 内存:内存使用百分比

    • 磁盘使用率:磁盘空间使用百分比,检查范围包括主机中所有已挂载(mount)的分区

    • 内网进流量:主机网卡的进流量,检查范围包括主机所有网卡

    • 内网出流量:主机网卡的出流量,检查范围包括主机所有网卡

      warning
      其中内存和磁盘使用率监控暂不支持 Windows 和 CentOS 5.8

    公网IP

    • 公网进流量:从公网 IP 进来的流量
    • 公网出流量:从公网 IP 出去的流量

    路由器

    • 内网进流量:路由器所连网络的进流量,检查范围包括所有与此路由器连接的私有网络
    • 内网出流量:路由器所连网络的出流量,检查范围包括所有与此路由器连接的私有网络

    负载均衡器

    1. 监听器 HTTP/HTTPS 协议
    • 请求数:接收到的请求数
    • 平均响应延迟时间:监听器下所有后端的响应时间
    • 平均并发数:并发连接数
    • 后端1xx/2xx/3xx/4xx/5xx响应数:监听器下所有后端返回的,对应状态码的响应数
    1. 监听器 TCP 协议
    • 连接数:监听器下所有后端的 TCP 连接数
    • 平均并发数:并发连接数
    1. 后端服务 HTTP 协议
    • 平均响应延迟时间:监听器下所有后端的响应时间
    • 后端1xx/2xx/3xx/4xx/5xx响应数:此后端返回的,对应状态码的响应数
    1. 后端服务 TCP 协议
    • 连接数:此后端的 TCP 连接数

    关系型数据库

    关系型数据库的监控告警只会监控 “主节点” ,包括如下监控项:

    • CPU:CPU 使用百分比
    • 内存:内存使用百分比
    • 磁盘使用率:磁盘空间使用百分比
    • 活跃连接数:数据库的活跃连接数
    • 查询请求:数据库执行的所有查询请求的次数
    • 慢查询:根据数据库配置的慢查询标准,监控慢查询的次数
    • 全表扫描次数:发生全表扫描的次数。
      (全表扫描是数据库服务器用来搜寻表的每一条记录的过程, 直到所有符合给定条件的记录返回为止,大多发生在对无索引的表进行查询)

    创建告警策略

    首先我们需要创建一个告警策略,指定资源类型、检查周期、告警条件、通知列表等信息。
    之后便可将其与资源关联,开始监控。下面以主机监控告警为例,介绍创建的步骤。

    在控制台导航中点击『监控告警』进入告警页面,然后点击『创建』按钮开始创建。

    参数设置

    参数设置可输入名称,资源类型和监控周期。
    其中资源类型决定了这个告警策略可支持哪些监控项,不同的资源支持不同的
    监控项 <support_meters> ,
    在指定了资源类型后,这个告警策略只能关联同类型资源。
    此例中我们选『主机』。

    监控周期则表示检查频率,会直接影响价格。

    note
    告警策略只有在绑定监控资源后才会计费: 总价=单价 x 资源个数

    告警规则

    这一步可对资源支持的监控项设置多条告警规则,任何一条满足条件都会触发告警。

    note
    监控数据采样间隔都是1分钟,所以在设置阈值时,可能需要考虑这个时间因素。

    告警行为

    最后一步作为可选项,可设置发送通知到
    通知列表 <guide-notificationlist> ,
    在资源的告警状态发生变化时收到通知。

    目前告警行为仅支持发送通知,以后还会支持更多操作。

    到此告警策略便创建完成了,如果之后需要修改或调整,都可在告警策略详情页中操作。
    需要注意的是,告警策略一旦创建完成,其『资源类型』属性便不可改变了。
    如果需要其他资源类型的告警,请另行创建相应的策略。

    添加监控资源

    告警策略创建完成后,便可给它添加监控资源。如下图所示,在告警策略详情页的基本属性菜单中点击
    『添加监控资源』,之后在弹窗中选择要监控的资源即可。

    添加监控资源后,监控服务便会自动对资源开始监控。
    如果资源被删除,其所关联的监控告警也会随之解除。

    查看告警历史

    资源监控过程中的重要事件都会记录在告警历史中。告警历史可在资源详情页中看到,历史记录包括:

    • 当修改了告警策略,并应用修改后,历史中会有一条配置变化的记录。
    • 当资源监控状态发生变化时,会有相应的记录,
    • 当执行告警事件时,也会有相应的记录,

    监控告警有三个状态:正常,告警,监控数据不足。其中监控数据不足是指没有取到监控数据,
    这通常是因为资源已关闭,或公网 IP 已解绑导致。

    负载均衡器监听器或后端服务的告警历史的查看需要鼠标点击『操作』或者右键某个后端服务,再选『监控告警』。
    如图所示:

    监控历史会保留最近 50 条记录,更早的记录会定期删除。


登录后回复
 

与 青云QingCloud 社区 的连接断开,我们正在尝试重连,请耐心等待