Zabbix Timeout 设置不当导致的问题

这篇具有很好参考价值的文章主要介绍了Zabbix Timeout 设置不当导致的问题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

哈喽大家好,我是咸鱼

今天跟大家分享一个关于 zabbix Timeout 值设置不当导致的问题,这个问题不知道大家有没有碰到过

问题

事情经过是这样的:

把某一台 zabbix agent 的模板由原来的 Template OS Windows by Zabbix agent 换成了 Template OS Windows by Zabbix agent active

Zabbix Timeout 设置不当导致的问题

Template OS Windows by Zabbix agent active 使用 主动模式 主动获取数据

Template OS Windows by Zabbix agent 使用 被动模式 等待 Server 请求数据

也就是说在主动模式下,Zabbix Agent 主动连接到 Zabbix Server 并发送监控数据,Zabbix Server 只需监听指定的端口,接收 Agent 发送过来的数据

结果发现 zabbix server 接收不到数据

排查

查看 agent 日志(/var/log/zabbix/zabbix_agentd.log),发现 ZBX_TCP_READ() timed out

  8452:20230620:134942.947 active check configuration update from [192.168.149.129:10051] started to fail (ZBX_TCP_READ() timed out)
  8452:20230620:135044.072 active check configuration update from [192.168.149.129:10051] is working again
  8452:20230620:140049.959 active check configuration update from [192.168.149.129:10051] started to fail (ZBX_TCP_READ() timed out)
  8452:20230620:140149.093 active check configuration update from [192.168.149.129:10051] is working again

而且经过进一步排查,发现:

  • server 节点运行正常,agent 节点正常运行
  • server 节点和 agent 节点之间可以 ping 通,而且 Telnet 端口可用

综合上面的现象,怀疑是网络原因导致 TCP 建立连接时间超时,agent 向 server 发送数据失败

既然是网络原因,那为什么我在修改模板(即被动模式)之前,server 是能够向 agent 获取数据的

怎么被动模式就没超时,主动模式就超时了呢?

解决

在 Zabbix 中,timeout(超时)是指在进行监控数据获取或传输时,等待响应的时间限制

在配置文件中如下所示,默认值是 3 s

### Option: Timeout
#       Spend no more than Timeout seconds on processing
# Timeout=3

我们分别来看下 server 和 agent 关于超时时间的配置

#server 端
Timeout=30

#agent 端
Timeout=3

可以看到,sever 端设置的超时时间是 30 s,agent 端设置的超时时间是 3s,这两个时间相差太大了吧

如果 agent 的 timeout 设置得太短,可能会导致一些请求无法完成;而如果 server 的 timeout 设置得太短,可能会导致 agent 的请求被错误地判定为超时

结合上面的情况,可以得知:

  • 主动模式下,agent 向 server 发送数据的时候,agent 端设置的超时时间是 3s,有可能会出现网络原因导致 TCP 建立连接时间超时,server 端获取不到数据,就会出现上面的问题
  • 被动模式下,server 向 agent 获取数据,但是 server 端设置的超时时间是 30s,这个超时时间可以说是非常大了

我们把 agent 端的超时时间改一下,跟 server 端一致

#agent 端
Timeout=30

重启 agent 后发现日志没有报 started to fail (ZBX_TCP_READ() timed out) 错,zabbix server 端也能够获取数据了
Zabbix Timeout 设置不当导致的问题

总结一下:

  • 在 Zabbix 中,timeout 是指在进行监控数据获取或传输时,等待响应时间的限制
  • Agent 和 Server 之间的超时时间设置应该相互协调,并根据实际网络状况和环境来进行调整。如果 Agent 的 timeout 设置得太短,可能会导致一些请求无法完成;而如果 Server 的 timeout 设置得太短,可能会导致 Agent 的请求被错误地判定为超时
  • 主动模式下 agent 的 timeout 值最好高于 server 配的 timeout 值,被动模式下 server 配的 timeout 值最好高于 agent 的 timeout

If used with the passive agent, Timeout value in server configuration may need to be higher than Timeout in the agent configuration file. Otherwise the item may not get any value because the server request to agent timed out first.文章来源地址https://www.toymoban.com/news/detail-499577.html

到了这里,关于Zabbix Timeout 设置不当导致的问题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • K8s攻击案例:RBAC配置不当导致集群接管

    01、概述 Service Account本质是服务账号,是Pod连接K8s集群的凭证。在默认情况下,系统会为创建的Pod提供一个默认的Service Account,用户也可以自定义Service Account,与Service Account关联的凭证会自动挂载到Pod的文件系统中。 当攻击者通过某个web应用获取到一个Pod权限时,如果RBAC权

    2024年02月02日
    浏览(46)
  • vue大坑:v-for的key以及props传参不当导致的闭包

    为什么props传参在模版中使用没问题,在函数中使用不变化 场景 当我们点击上方的月份时,会改变下方加载的卡片信息 代码: 父组件: 字组件 流程: 当我们点击月份的时候,会加载对应月份的子组件卡片 当我们点击某一个子组件的时候,会判断是否跳转 问题: 如果我们

    2023年04月14日
    浏览(42)
  • win11系统,由于分区操作不当导致电脑开不开机,报错EFI PXE Network(xxxxxx)boot failed。

    win11系统,在给磁盘分区的时候操作不当,导致开机时出现了“ EFI PXE Network(xxxxxx)boot failed \\\"错误. 解决方法:先试方案一,不行试方案二,还不行试方案三重装系统 方案一: 1,开机或者重启电脑的时候(在出现Lenovo之前)连续不停的按“F2键”进入BIOS界面 2,点击右下角

    2024年02月09日
    浏览(136)
  • DHCP设置不当故障的解决方法

    DHCP设置不当故障的解决 近日,朋友所在单位对局域网进行了拓展,同时增加了10多台终端,以便满足更多员工的上网访问要求。原以为这样的拓展工作很简单,可是谁曾想到,将新买回来的终端按照正确设置,接入局域网环境中后,竟然出现了奇怪的故障现象,一部分终端能

    2024年02月05日
    浏览(43)
  • IP改变导致Zabbix不能访问的解决办法

    目录 解决方式一 1.关闭防火墙和selinux 2.查看ip地址 3.修改zabbix-php的配置文件 4.重启mysqld 5.访问页面 6.修改zabbix-agent.conf 的配置 7.重启zabbix-agent 验证zabbix-agent是否启动 解决方式二 更改ip地址 1.首先查看网卡名称和ip 2.修改网络的配置文件固定ip 博主推荐使用第二种方式,可以

    2024年02月08日
    浏览(50)
  • 关于Vivado仿真时,时钟信号初值设置方法导致仿真结果不一致的问题分析

    本文以余3码加法计数器的设计为例,说明仿真激励过程中遇到的问题,解决方法及分析。 加法器电路的实现代码如下: 仿真激励文件1的代码如下: 仿真结果如下图所示:  这里,clk信号的初值设为1,得到的仿真结果,说明了,在clk的下降沿状态会发生转移。在前10ns,由于

    2024年02月12日
    浏览(50)
  • 关于使用druid数据源连接Oracle导致的SQLRecoverableException(socket read timeout,关闭的连接等)

    数据源初始化后,获取Oracle的连接进行查询操作,相隔 半个小时 左右,再次对同一数据库进行查询操作。 第二次查询的时候,就会出现如下一些异常情况 一开始以为是查询的数据量太大(7.9W+),于是网上查了druid对Oracle数据库的读超时时间相关的设置,配置如下,设置后发现仍旧

    2024年04月16日
    浏览(54)
  • seatunnel hive source 未设置分隔符导致多个字段合并成一个的问题定位解决

    seatunnel hive source 未设置分隔符导致多个字段没有切分全保存在一个字段中了,翻看源码发现分隔符是是通过delimiter设置的,只要设置这个delimiter=\\\",\\\"就可以了。 设置这个属性 delimiter=“,” 他的默认值是u0001,如果没有设置delimiter属性则会根据文件类型判断,如果是csv则使用”,”

    2024年02月16日
    浏览(51)
  • axios 设置超时时间 timeout

    在项目中,所有请求都是走统一封装过的axios,统一设置了超时时间: 但是有一个接口耗费时间巨长,网络不好时经常会超时,改统一设置的超时时间感觉不太好,所以想针对这个请求单独设置超时时间。 以下是普通请求: 单独设置请求超时时间:

    2024年02月16日
    浏览(45)
  • Axios设置请求超时时间 timeout

    1.axios全局设置网络超时 2. 单独对某个请求设置网络超时 3.webpack的dev的proxyTable的超时时间设置

    2024年04月10日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包