优维产品最佳实践第13期:如何避免拨测机自身网络问题?

这篇具有很好参考价值的文章主要介绍了优维产品最佳实践第13期:如何避免拨测机自身网络问题?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

优维产品最佳实践第13期:如何避免拨测机自身网络问题?,拨测,监控,运维

受限于拨测节点自身的环境,单一节点的拨测结果可能并不能反映出监控实例的真实运行状态

本期EasyOps产品使用最佳实践,我们将为您揭晓:

  • 如何基于多点决策配置拨测监控,以避免拨测机自身网络问题而误告警?

  • 如何对指标实现“降维”,从而汇聚指标?

「 背 景 」

拨测监控作为监控体系中重要的一环,为管理员提供最为直接的状态监控。然而,受限于拨测节点自身的环境和网络环境,可能单一拨测节点的结果并不能反映出监控实例的实际运行状态。比如,当拨测节点所在的网络发生故障时,或者和监控实例的网络中断时,此时会认为监控实例的服务不可用。

但是,这种判断可能是错误的。

因此,多点决策的需求就产生了。它基于这样一种监控逻辑:假设有两个拨测节点,分布于两个不同的环境或者网络,同时对目标实例拨测。仅当超过半数的拨测节点(也就是两台拨测机都发生告警时),才认为目标实例异常时,才发出拨测告警。

before:

优维产品最佳实践第13期:如何避免拨测机自身网络问题?,拨测,监控,运维

after:

优维产品最佳实践第13期:如何避免拨测机自身网络问题?,拨测,监控,运维

「 配 置 说 明 」

1.针对主机配置拨测采集策略,并且指定两台拨测机。

优维产品最佳实践第13期:如何避免拨测机自身网络问题?,拨测,监控,运维

2.配置汇聚指标,这里作详细说明:

拨测的指标:detect_code包含着多个维度,而我们希望把detectAgentId和detectAgentName这两个维度降维了,让detect_code可通过jobId来汇聚成一个指标。

因此,需要作如下配置表达式:avg(detect_code ) by (stepName,jobId,customTag)

优维产品最佳实践第13期:如何避免拨测机自身网络问题?,拨测,监控,运维

上述表达式,说明新指标的维度是stepName,jobId,customTag,把agent相关的维度聚合在一起了。

此时,两台拨测机的汇聚结果可参考如下表格:

优维产品最佳实践第13期:如何避免拨测机自身网络问题?,拨测,监控,运维

可知,只有当两台拨测机都返回1的返回码时,也就是两台拨测机都认为实例故障时,多点决策返回码才大于0.5,因此0.5可以作为多点决策的判断阈值。

3.配置告警规则

优维产品最佳实践第13期:如何避免拨测机自身网络问题?,拨测,监控,运维

此时,当两台拨测机都探测目标实例失败时,才会发出拨测失败的告警。如果只有一台拨测机认为拨测失败,并不会发出告警,以实现了半数以上判断为失败才失败的逻辑。

该实践提供了多点决策的能力,弥补了拨测节点的单点缺陷。文章来源地址https://www.toymoban.com/news/detail-739634.html

到了这里,关于优维产品最佳实践第13期:如何避免拨测机自身网络问题?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 优维DevOps全新产品——双态部署重磅上线

    优维又一全新产品上线啦! 最近,优维召开了一场发布会,宣布 「DevOps全新产品——双态部署」重磅上线 。发布会现场,重新审视了DevOps市场现状,深度剖析了行业面临的挑战与机遇,同时也深入浅出的揭晓了“双态部署”是如何应对当下的种种挑战的。 下面就跟着鹿小

    2024年02月13日
    浏览(49)
  • 【腾讯云 TDSQL-C Serverless 产品体验】TDSQL-C MySQL Serverless最佳实践

    随着云计算技术的不断发展,越来越多的企业开始选择将自己的数据库部署在云上,以更好了的支持企业数字化转型以及业务创新,在这个过程中,很多客户会遇到这样一个问题,业务会存在高峰期和低谷期,同样数据库的访问量也是会存在相应的高峰期和低谷期。 序号 业

    2024年02月07日
    浏览(49)
  • 【腾讯云 TDSQL-C Serverless 产品体验】基于TDSQL-C Serverless最佳实践助力企业降本增效

    随着公司的业务快速发展,数据库中的数据量猛增,访问性能也变慢了,单台MySQL实例无法应对和满足大规模数据管理和请求访问,导致数据库性能下降,成为瓶颈。 关系型数据本身就比较容易形成系统瓶颈,无论是从单机存储容量、连接数、处理能力都有限。 当单表的数据

    2024年02月08日
    浏览(47)
  • 优维低代码实践:函数

    优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维低代码实践连载第16期 《函数》 ▽ 一、概

    2024年02月09日
    浏览(37)
  • 优维低代码实践:菜单

    优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维低代码实践连载第17期 《菜单》 ▽ 在微应

    2024年02月09日
    浏览(40)
  • 优维低代码实践:模板

     优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维低代码实践连载第⑥期 《模板》 ▽ Vi

    2024年02月16日
    浏览(37)
  • 优维低代码实践:添加构件

     优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维低代码实践连载第11期 《添加构件》 ▽

    2024年02月15日
    浏览(37)
  • 优维低代码实践:对接数据

    优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维低代码实践连载第13期 《对接数据》 ▽

    2024年02月14日
    浏览(44)
  • 优维低代码实践:权限设置

     优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维低代码实践连载第⑨期 《权限设置》 ▽

    2024年02月15日
    浏览(37)
  • 优维低代码实践:统计视图

      优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维低代码实践连载第⑩期 《统计视图》

    2024年02月16日
    浏览(65)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包