【MySQL技术专题】「问题实战系列」MySQL报错Got an error reading communication packets问题分析指南

这篇具有很好参考价值的文章主要介绍了【MySQL技术专题】「问题实战系列」MySQL报错Got an error reading communication packets问题分析指南。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


前因背景

当系统服务的MySQL错误日志中,发现大量以下类似信息:经常收到客户关于通信故障错误的问题—客户面临间歇性的”Got an error reading communication packet”错误,这里分析这个错误出现的原因,以及如何解决这个问题。

Aborted connection 1055898 to db: 'xxx' user: 'yyy' host: 'xxx.xxx.xxx.xxx' (Got timeout reading communication packets)

官方解释

下面看看官网怎么说:

Aborted_connects:

If a client is unable even to connect, the server increments the Aborted_connects status variable.

A client attempts to access a database but has no privileges for it.
#客户端没有权限但是尝试访问MySQL数据库
A client uses an incorrect password.
#客户端输入的密码有误。
A connection packet does not contain the right information.
#连接包不包含正确信息
takes more than connect_timeout seconds to obtain a connect packet.
#超过连接时间限制,主要是这个系统变量connect_timeout控制(mysql默认是10s,基本上,除非网络环境极端不好,一般不会超时。)
Aborted_clients:

lIf a client successfully connects but later disconnects improperly or is terminated, the server increments the Aborted_clients status variable

The client program did not call mysql_close() before exiting…
#客户端没有进行关闭
The client had been sleeping more than wait_timeout or interactive_timeout seconds without issuing any requests to the server.
#客户端睡眠时间超过了wait_timeout或interactive_timeout秒,而没有向服务器发出任何请求。
The client program ended abruptly in the middle of a data transfer.
#客户端程序在数据传输过程中突然终止。
Aborted_connects OR Aborted_clients:

Other reasons for problems with aborted connections or aborted clients:

the max_allowed_packet variable value is too small or queries require more memory than you have allocated for mysqld
#max_allow_packet设置过小
Use of Ethernet protocol with Linux, both half and full duplex. Some Linux Ethernet drivers have this bug
#Linux以太网驱动程序有这个bug
A problem with the thread library that causes interrupts on reads.#线程库中导致读取中断的问题。
Badly configured TCP/IP. #tcp/iip 配置信息混乱
Faulty Ethernets, hubs, switches, cables, and so forth. This can be diagnosed properly only by replacing hardware.
#故障的以太网、集线器、交换机、电缆等等

https://dev.mysql.com/doc/refman/5.7/en/communication-errors.html

Aborted connection情况下,这也意味着以下几个问题:

  1. 客户端正常连接,但是被异常结束(可能是程序没有正常关闭连接)
  2. 客户端sleep的时间超过了wait_timeout、或interactive_timeout的值(这会导致连接被mysql强制关闭)
  3. 客户端异常终端,或者查询超出max_allowed_packet的值

临时配置解决办法

设置最大包大小
set global max_allowed_packet = 1024*1024*1024;
查看包大小
mysql> show variables like '%max_allowed_packet%';
+--------------------------+------------+
| Variable_name            | Value      |
+--------------------------+------------+
| max_allowed_packet       | 16777216   |
| slave_max_allowed_packet | 1073741824 |
+--------------------------+------------+
永久配置解决办法
[mysqld]
max_allowed_packet=256M

当然,也可能是其它原因导致的。坦白讲,异常中断是很难诊断的,也有可能是和网络、防火墙有关。

从以下几个方面考虑:
  1. 如果有大量的连接进程处于sleep状态时间较长,也就意味着应用没有正确、及时关闭数据库连接。强烈建议在应用中能恰当地关闭数据库连接,否则就需要依赖mysql的wait_timeout的设置来关闭连接了。
  2. 建议检查max_allowed_packet的值,确保该值设置的合理,这样客户端就不会接收到"packet too large"消息提示。如果设置不合理,会异常中断连接。
  3. 建议关注线程的time_wait数量。如果netstat发现有大量的连接处于time_wait状态,表示该建议应用端调整连接关闭问题了。
TIME_WAIT的处理方案
netstat -ano|grep TIME_WAIT

tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:55586      TIME_WAIT   timewait (32.97/0/0)
tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:55367      TIME_WAIT   timewait (27.82/0/0)
tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:55776      TIME_WAIT   timewait (37.09/0/0)
tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:56505      TIME_WAIT   timewait (54.61/0/0)
tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:55553      TIME_WAIT   timewait (31.94/0/0)
tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:56643      TIME_WAIT   timewait (57.73/0/0)
tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:55221      TIME_WAIT   timewait (23.70/0/0)
tcp        0      0 xxx.xxx.xxx.xxx:10054       xxx.xxx.xxx.xxx:55920      TIME_WAIT   timewait (41.18/0/0)
网络问题分析
  • 检查DNS配置是否有延迟问题。

    • 检查是否同时配置了skip_name_resolve,且使用IP验证主机而不是使用主机名。设置该参数后,使用ip验证主机,而不是使用主机名。使用该参数后,mysql授权表中的host列必须是IP地址或者localhost。
  • 增加net_read_timeout、net_write_timeout的值,并观察是否还有该错误发生;

    • net_read_timeout很少会导致出错,除非网络环境非常差。
mysql的参数设置:
mysql> show variables like '%timeout%';
+-----------------------------+----------+
| Variable_name               | Value    |
+-----------------------------+----------+
| connect_timeout             | 10       |
| interactive_timeout         | 1800     |
| lock_wait_timeout           | 31536000 |
| net_read_timeout            | 30       |
| net_write_timeout           | 60       |
| wait_timeout                | 1800     |
+-----------------------------+----------+
  • 连接异常中断是因为连接没有被正常关闭。
    • server端不会导致连接abort,除非客户端/服务器端发生了网络问题。而不是server端的问题。
tcpdump,netstat -s
log_warnings掩耳盗铃

【MySQL技术专题】「问题实战系列」MySQL报错Got an error reading communication packets问题分析指南,# 深入浅出MySQL原理及实战,mysql,数据库,服务器
【MySQL技术专题】「问题实战系列」MySQL报错Got an error reading communication packets问题分析指南,# 深入浅出MySQL原理及实战,mysql,数据库,服务器

mysql> show global variables like '%log_warning%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_warnings  | 2     |
+---------------+-------+
1 row in set (0.00 sec)

如果log_warnings的值大于1,mysql会将类似信息写入错误日志:

[Warning] Aborted connection 305628 to db: 'db' user: 'dbuser' host: 'hostname' (Got an error reading communication packets)
[Warning] Aborted connection 305627 to db: 'db' user: 'dbuser' host: 'hostname' (Got an error reading communication packets)

可以修改一下log_waring的值:

set global log_warnings=1;

但这样直接修改,重启后会失效,修改配置文件mysql.cnf log_warnings = 1文章来源地址https://www.toymoban.com/news/detail-726317.html

到了这里,关于【MySQL技术专题】「问题实战系列」MySQL报错Got an error reading communication packets问题分析指南的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包