java.net.NoRouteToHostException No route to host的排查与解决思路分享

这篇具有很好参考价值的文章主要介绍了java.net.NoRouteToHostException No route to host的排查与解决思路分享。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

相信很多朋友曾经都遇到过这个问题,最近也是被这个错误折磨的怀疑人生。在执行HiveSQL的时候总是时不时报错,could not find status of job

caused by: java.net.noroutetohostexception: no route to host (host unreachab,服务器,大数据,hadoop
然后进入yarn的日志里面,发现具体的错误为No route to host

caused by: java.net.noroutetohostexception: no route to host (host unreachab,服务器,大数据,hadoop
其实这个错误首先看起来是很明确的,没有主机的路由,经过网上查询,总结起来有这么3个原因:

1、对方的域名确实不通
2、本机开了防火墙
3、etc/hosts 里面没有配置本机的机器名和ip

但是很显然,这都是一些比较低级的错误,简单排查一下并不是这些原因。其实这个问题以前也发生过,但是发生的频率是极其低的,导致不能复现,二是也没有太好的办法,就单单一个No route to host有点无从下手,所以一直以来都没有搞清楚到底是什么原因。

但是最近频率变得非常高,在很多次的复现过程中,发现一个重要的信息,好像每次都是同样一台主机。

No Route to Host from  datanode22 to namenode2:9820 failed on socket timeout exception: java.net.NoRouteToHostException: No route to host

那问题肯定就出在这个datanode22中了,经过简单的测试发现,在HiveSQL的执行过程中,hadoop的心跳时间经常很大,整个hadoop集群的心跳超时时间设置为600S(这个值设置的非常大,其实是有点不合理的),在web页面上能看见该节点的last contact为三百多秒,和宕机差不多。

随后经过测试,发现datanode22节点一旦启动两个或以上的container,就会极大概率宕机,然后在任务执行完成或失败后恢复正常。

这种情况有可能是磁盘也有可能是cpu,随后用dd命令简单测试了下磁盘的实时写入性能,发现只有5M,这肯定不正常,因为另外一台节点有100M

dd if=/dev/zero of=test bs=8k count=256k conv=fdatasync //测试命令

所以最后总结,就是在一个stage完成后,datanode22宕机导致该错误的发生,解决该问题也很简单,有问题的节点改下yarn配置,只让执行一个map或者reduce。文章来源地址https://www.toymoban.com/news/detail-762461.html

到了这里,关于java.net.NoRouteToHostException No route to host的排查与解决思路分享的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • connect to address IP: No route to host

    connect to address IP: No route to host telnet服务器的端口,报错:telnet: connect to address IP: No route to host 解决办法 原因:telnet的目标服务器防火墙导致。 解决办法:将需要的端口在目标服务器放行或关闭防火墙即可。

    2024年02月16日
    浏览(30)
  • k8s pod启动报错: no route to host

    查看pod命令 查看报错pod日志 命令: pod报错都一样: no route to host 原因: 找不到这个路由对应的地址,关闭防火墙,重启k8s,执行下面命令即可。 正常线上是不能关闭防火墙,这个属于pod内部之间的host调用失败,有大神知道的这种情况怎么处理的, 可以在评论区告知一下,

    2024年02月13日
    浏览(48)
  • docker search 镜像报错: connect: no route to host (桥接模式配置静态IP)

    可能有多种: ① 没有开放防火墙端口 ② ip地址配置有误 我是因为 虚拟机采用了桥接模式,配置静态ip地址 有问题。 先确认虚拟机采用的是 桥接模式,然后启动虚拟机。 查看本机无线网适配器地址: 这里要配固定静态ip前,先查看一下主机ip已经占用的有哪些: (中间的

    2024年02月14日
    浏览(40)
  • kubesphere-- Unable to connect to the server: dial tcp 192.168.211.182:6443: no route to host

            最近鼓捣kubesphere单节点安装,部署服务,使用流水线用的好好的,有两次重启服务器突然显示kubesphere连接不上。初步排查,使用 kubectl get pods --all-namespaces 命令,显示kubectl不可用,缺少路由。 Unable to connect to the server: dial tcp 192.168.211.182:6443: connect: no route to host    

    2024年02月03日
    浏览(50)
  • kubectl命令报错:Unable to connect to the server: dial tcp XXX:16443: connect: no route to host

    前提 架构: keepalived+haproxy+kubernetes 问题说明 kubernetes集群好久不用了,今天打开集群执行一个 kubectl get nodes 命令,报错如下: Unable to connect to the server: dial tcp 192.168.2.XXX:16443: connect: no route to host 分析原因 出现这个问题几种原因, 集群坏了:如果报错的IP是master1的节点IP或虚

    2024年02月09日
    浏览(125)
  • 解决:java.net.NoRouteToHostException: 没有到主机的路由

    解决:java.net.NoRouteToHostException: 没有到主机的路由 在执行spark程序的jar包时,出现下面问题 查看: http://wiki.apache.org/hadoop/NoRouteToHost中,提示如下 可以根据上面查找问题 我出现 java.net.NoRouteToHostException: 没有到主机的路由 是虚拟机之间的 防火墙 没有关闭 查看防火墙状态

    2024年02月12日
    浏览(39)
  • zookeeper出现java.net.NoRouteToHostException: 没有到主机的路由问题解决

             本人用的版本稍微有点旧,用的是VMware11、centos用的是6.5版本的、JDK用的是1.8的、Hadoop用的是3.2.1版本的、zookeeper用的是3.5.6的。在前面的配置中一直没有问题,经过反复排查zookeeper的配置是没有问题的,用jps查看进程,QuorumPeerMain进程都正常启动。        但是用

    2024年02月12日
    浏览(46)
  • 已解决java.net.NoRouteToHostException: 无法到达主机异常的正确解决方法,亲测有效!!!

    已解决java.net.NoRouteToHostException: 无法到达主机异常的正确解决方法,亲测有效!!! 目录 问题分析 报错原因 解决思路 解决方法 检查网络连接 核实目标地址 检查防火墙和路由器规则 验证VPN/代理设置 修正网络配置 总结  博主v:XiaoMing_Java java.net.NoRouteToHostException 是一种在

    2024年04月26日
    浏览(34)
  • [已解决]使用git拉代码时报错: Unable to negotiate with **** port 22: no matching host key type found.

    在网上搜一波都是让生成ssh公钥然后部署到服务器上,然后折腾一晚上,以为就是这个问题,但还是不行。 后来发现原来是当时本来本地已经有生成过公钥了,但我怕重复,所以删掉了以前的,还连着删了几个其他文件,无语! 原因可能是新的ssh客户端不支持ssh-rsa算法,要

    2024年02月12日
    浏览(39)
  • Failed to load response data: No data found for resource with given identifier 错误问题排查解决

    同事在一个新的环境里部署了一套测试环境,因为服务器内存问题等问题,没有采用容器部署,直接进行打包部署的,用nginx做代理完成。 部署完成后,也是遇到一系列的问题,其中 Failed to load response data: No data found for resource with given identifier  这个问题在平台里导出都有报,

    2024年01月19日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包