限制 SLS告警通知时段的几种常见方法

这篇具有很好参考价值的文章主要介绍了限制 SLS告警通知时段的几种常见方法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

在对系统进行监控告警的过程中,有时候并非在任何时候都要接收告警通知,例如以下场景:

  • 计划内变更触发的已知告警可以无需通知
  • 非工作时间不接收不严重的告警
  • 夜里不接收电话告警
  • 等等

本文会介绍几种常见的限制告警通知时段的方法,以及它们各自所适用的场景。

方案比较

各种方案的比较参考如下,在实际配置告警过程中,可以按照实际需求选择合适的方案。

Cron表达式 临时关闭 静默策略 全局日历 值班组
作用阶段 影响告警评估,从而影响通知 影响告警评估,从而影响通知 仅影响通知 仅影响通知 仅影响通知
支持的通知渠道 不限制 不限制 不限制 不限制 支持所有与人相关的通知渠道,例如短信、电话、邮件,以及钉钉等可以@用户的场景。
是否可以复用 无法复用,需要针对每个告警规则单独配置 无法复用,需要针对每个告警规则单独配置 可以 可以 可以
是否临时设置
支持的场景 较复杂 简单 简单 较复杂 复杂
配置复杂度 简单 简单 较复杂 简单 较复杂

通过 Cron 表达式限制告警触发时间段

在配置告警规则的时候,需要设置告警规则的检查频率,例如设置为固定5分钟间隔,则梅5分钟该规则就会对数据进行一次检查评估,判断是否需要触发告警。

监控 静默策略,java,数据库,linux,阿里云,云计算

这里除了设置固定间隔外,还支持设置 Cron 表达式。这里使用的是标准的 Cron 表达式,最小时间粒度为分钟。一共分为5段,分别表示:分钟、小时、日、月、周。例如:

  • 0/5 * * * *表示从0分钟开始,每隔5分钟检查一次
  • 0 0/1 * * *表示从0点0分开始,每个1小时检查一次
  • 0 18 * * *表示每天18点0分检查一次
  • 0 0 1 * *表示每月1日的0点0分检查一次

除了这些基础的使用之外,还可以使用稍微复杂一些的 Cron 表达式,实现更加灵活的告警时间段限制。

  • 例如只希望白天8点到18点之间触发告警,则可以设置为 0/5 8-17 * * *,这个配置表示从 08:00 开始,到 17:59 结束,每5分钟会执行一次告警检查,其余时间则不执行。
  • 例如希望周一到周五的上午8点到12点,下午14点到18点之间,每分钟都执行一次告警,则可以配置为* 8-11,14-17 * * 1-5

关于 Cron 表达式的更多使用以及介绍,可以参考 https://crontab.guru/

通过临时关闭告警来限制告警触发时间段

针对某些预期内的告警(例如临时做系统变更,会有一些已知告警),我们希望它们在今后的一段时间内不再通知,那么可以通过临时关闭功能,暂时关闭某个告警。

监控 静默策略,java,数据库,linux,阿里云,云计算

临时关闭后,在该时间之内,告警规则就不会继续检查和触发,超过该时候之后,告警规则会恢复正常。

监控 静默策略,java,数据库,linux,阿里云,云计算

如果想要提起中断该作用,只需要点击“恢复”操作即可。

通过静默策略限制告警通知时间

通过临时关闭告警,作用的只是某一个告警规则。如果需要针对多个告警规则都需要在接下来的一段时间内不通知,可以通过静默策略来实现。例如在某集群升级过程中,可能会有一系列的预期内告警,希望对这些告警做屏蔽。

如果这些告警使用的都是同一个告警策略,则可以在告警策略中设置静默规则,例如针对所有 test-project 这个项目产生的告警,临时屏蔽一段时间,则可以设置如下:

监控 静默策略,java,数据库,linux,阿里云,云计算

该配置即表示,对于 test-project 这个项目产生的告警,会在 2022年12月2日的12点到18之间进行屏蔽,不会通知。

通过日历设置工作日与工作时间

如果希望针对全局告警实现相同的通知时间配置,可以使用全局日历功能。例如在全局日历中设置工作日和工作时间:

监控 静默策略,java,数据库,linux,阿里云,云计算

然后就可以在行动策略中设置发送时段:

监控 静默策略,java,数据库,linux,阿里云,云计算

这样所有使用了该行动策略的告警都会遵守该时间段设置,只会在工作时间(根据上图的示例配置,即每周一到周五的9点到18点之间)发送告警,超出该时间范围则不会通知。

更多关于全局日历以及日期重置的使用,可以参考文档:

  • https://help.aliyun.com/document_detail/207706.html
  • https://help.aliyun.com/document_detail/209961.html

通过值班组实现灵活的值班时间

全局日历主要解决的是全局工作日、工作时间相关的配置。如果针对个别告警,需要使用不同的发送时段设置,可以考虑使用值班组来实现完全灵活且自定义的发送时段。

例如需要每天夜间(0点到7点)接收通知,则可以新建值班组,然后添加轮岗,配置参考如下:

监控 静默策略,java,数据库,linux,阿里云,云计算

保存后切换到“最终排班”模式查看,可以看到每天只有特定时间段是值班的,即只在这个特定时间段内才会接收到告警通知。

监控 静默策略,java,数据库,linux,阿里云,云计算

然后行动策略中选择该值班组即可,例如:

监控 静默策略,java,数据库,linux,阿里云,云计算

需要注意的是,由于值班组里已经设定了时间段,所以行动策略里的“发送时段”选择“任意”即可,这样时间段就完全由值班组控制。如果这里“发送时段”选择了其它选项,那么最终的效果是,先使用全局日历判断是否发送通知,如果需要发送通知,才会使用值班组的时间段做二次判断。

更多关于值班组的使用,可以参考文档 https://help.aliyun.com/document_detail/207705.html

参考文档

  • 告警静默机制
  • 修改全局默认日历
  • 日历重置机制
  • 轮岗与代班场景

原文链接

本文为阿里云原创内容,未经允许不得转载。文章来源地址https://www.toymoban.com/news/detail-787029.html

到了这里,关于限制 SLS告警通知时段的几种常见方法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python操作PDF的几种常见方法

    大家好,有关python操作pdf的方法,各种语言处理起来都比较麻烦,而且各种第三方库的应用场景都不同。下面说明一下python如何通过第三方库如何处理pdf文件。 1.1、pdfplumber提取文本内容 安装pdfplumber pdfplumber提取PDF中文字代码思路如下 利用pdfplumber打开一个 PDF 文件 获取指定

    2024年02月03日
    浏览(43)
  • 求最大公约数的几种常见的方法 【详解】

    目录 一、关于公约数 二、计算最大公约数的方法  1. 辗转相除法(欧几里得算法) 2. 更相减损法(辗转相减法) 3. 分解质因数法 4. 穷举法  5. 递归法 6. 短除法 三、总结 首先 ,先介绍一下公约数: 公约数(公因数),一个能被若干个整数同时整除的的整数,公约数中最大

    2024年02月08日
    浏览(60)
  • 如何解决电脑无声问题:排除故障的几种常见方法

    大家好,今天我们来讨论一下处理电脑没有声音的故障。当你突然发现电脑静音无声时,需要逐步排除可能的问题,但总体而言,声音故障是相对容易解决的。接下来,我们将介绍一些排除电脑无声问题的方法。 第一步:检查是否处于静音或音响线松动状态。 检查是否处于

    2024年02月14日
    浏览(38)
  • 设置路由器刷新堵塞网络的几种常见方法介绍

    一般网络堵塞是造成网络变卡的原因,一般我们可以先断开网络再次的链接就OK了,那么再使用路由器上实现这个效果呢?下面分别介绍一种方法,保准你可以迅速的搞定。 禁用本地连接再重新启用的这种方式最常用的。具体的做法是先在桌面的右下角点击网络链接,然后就

    2024年02月06日
    浏览(41)
  • 【Git】Github 上传文件常见的几种错误及尝试的解决方法

    具体的错误类型为: 收到的错误信息表示我们正在尝试推送到GitHub上的一个分支,而该分支包含我们本地没有的提交记录。要解决这个问题,我们需要在再次推送之前将远程更改合并到你的本地分支中。 以下是我们可以执行的操作: 确保你已经提交了所有本地的更改。你可

    2024年02月13日
    浏览(43)
  • Linux使用make命令时常见的几种错误及其解决方法(Ubuntu适用)

    这是我在安装busybox时使用make menuconfig命令时所出现过的错误及我的解决方法,仅供参考: 1.出现Command \\\'make\\\' not found 解决方法: sudo apt-get install ubuntu-make sudo apt-get install make                 //我两条都输了一遍才解决问题 2.无法打开锁文件 解决方法: su           //然后输

    2024年02月04日
    浏览(59)
  • 限制登录Linux服务器的几种方式

    在日常运维中,我们通常使用防火墙iptables跟firewalld的方式来实现访问控制,但在实际环境中,开启防火墙可能会对业务造成影响,所以以下整理了三种限制登录Linux服务器的几种方式。分别是修改TCP Wrappers服务访问控制、修改sshd_config配置文件、防火墙策略iptables跟firewalld。

    2024年02月17日
    浏览(46)
  • 常见的几种排序

    🐶博主主页: @ᰔᩚ. 一怀明月ꦿ  ❤️‍🔥 专栏系列: 线性代数,C初学者入门训练,题解C,C的使用文章,「初学」C++ 🔥 座右铭: “不要等到什么都没有了,才下定决心去做” 🚀🚀🚀大家觉不错的话,就恳求大家点点关注,点点小爱心,指点指点🚀🚀🚀 目录 冒泡

    2024年02月15日
    浏览(40)
  • 常见的几种排序算法

    目录 一、插入排序 1、直接插入排序 1.1、排序方法 1.2、图解分析 1.3、代码实现 2、希尔排序 2.1、排序方法 2.2、图解分析 2.3、代码实现 二、选择排序 1、直接选择排序 1.1、排序方法 1.2、图解分析 1.3、代码实现 2、堆排序 2.1、排序方法 2.2、图解分析 2.3、代码实现 三、交换

    2024年02月09日
    浏览(47)
  • 常见的几种排序方式

    排序: 所谓排序,就是使一串记录,按照其中的某个或某些的大小,递增或递减的排列起来的操作 稳定性: 假定在待排序的记录序列中,存在多个具有相同的的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在

    2024年02月07日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包