问题1 reset Offset
某次生产线上,从KafkaManager监控页面,发现还剩几十万未消费数据量,过了几分钟之后,监控页面发现未消费数据量达到了几千万。
排查分析
定位生产日志,发现消费端 出现日志 reset offset
, 结合上下文日志,发现在切换broker leader之后,提交的偏移量在新leader上面找不到,之后根据消费端配置的auto offset reset
由于我们配置的是earliest,所以从最早消费
问题原因
切换时候,broker是接入某云的kafka,当时后台发生OOM,造成broker切换,由于ack设置,导致新切换的broker 没有提交的偏移量,从而导致整个现象发生
问题2 connection reset by peer
某次请求某服务,偶然频繁出现请求错误,但刷新错误之后,又可以重新打开请求链接
排查分析
根据traceId,定位到服务链调用,网关服务出现connection reset by peer
,说明调用我们的业务微服务出现问题, 日志上下文 观察调用IP有多个,可实际情况后台docker 的pod数量为1文章来源:https://www.toymoban.com/news/detail-593336.html
问题原因
由于eureka段配置不合理,导致未将失效的服务实例杀死,通过eureka注册中心可以管道有一个未清除的实例,从而导致该现象产生。
解决措施:先手动下线微服务实例,后修改配置文章来源地址https://www.toymoban.com/news/detail-593336.html
到了这里,关于reset Offset 与connection reset by peer的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!