K8S Error getting node问题的排查思路

1年前作者：看得见的风分类：Toy博客阅读(8)违法举报

这篇具有很好参考价值的文章主要介绍了K8S Error getting node问题的排查思路。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

在安装K8S集群或者运行过程中，大家可能会遇到"Error gettting node"的问题，例如：

"Error getting node" err="node \"master\" not found"
dial tcp 10.8.126.46:6443: connect: connection refused"
"Error getting node" err="node \"master\" not found"
"Error getting node" err="node \"master\" not found"

排查这类问题的方法是执行如下命令查看具体错误原因：

journalctl -xeu kubelet

找到最初的报错，根据不同的错误进行处理。
根据我遇到过的问题，主要有以下可能：文章来源地址https://www.toymoban.com/news/detail-537250.html

没有禁用swap内存
pause镜像没有下载成功（这里尤其要注意，因为阿里的kubernetes仓库虽然可以下载到k8s v1.23+以上的镜像，但是有一个问题，其pause容器还是用的k8s.gcr.io/pause:3.6，该镜像在国内服务器下载不成功，需要手工下载
hostname设置或hosts设置有问题（其他博主列的原因）
容器和k8s的版本不兼容（其他博主列的原因）

到了这里，关于K8S Error getting node问题的排查思路的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

关于k8s中的node_exporter异常write: broken pipe问题排查
公司网络更改重启服务器后，发现Prometheus监控中node节点三个挂掉了，实际上节点服务器是正常的，但是监控的node_exporter请求http://IP:9100/metrics超过10秒没有获取返回数据则认为服务挂掉。到各个节点服务器用curl命令检测多久返回数据 time_connect ：连接时间，从开始到TCP三次握
2024年02月10日
浏览(9)
K8S集群中Pod资源处于ImagePullBackOff状态排查思路
ImagePullBackOff状态表示容器的镜像拉取失败，可能存在以下几点原因：拉取镜像时间较长导致超时，从而导致镜像拉取失败，部署完Docker后，一定要添加上阿里云的镜像加速器，否则拉取镜像是非常慢的，很容易就会导致镜像拉取失败。镜像配置有误，指定的镜像在公有仓库
2024年02月14日
浏览(12)
K8S集群中Pod资源处于CrashLoopBackOff状态排查思路
CrashLoopBackOff状态一般都是Pod资源中的容器出现了问题，可以有以下几点原因：容器中部署的程序存在Bug，无法正常启动，就会出现此状态，可以查询容器的启动日志，从日志中获取重要线索，逐个进行排查。定义Pod资源时，对于Pod中的容器进行了资源限额，可能限额的资源
2024年01月21日
浏览(10)
K8S集群中Pod与Pod之间网络故障排查思路
在K8S集群中，可能会出现Pod与Pod之间无法通信的现象，也就是说Pod无法跨Node主机进行通信，Pod与Pod之间网络不通讯会导致无法请求Pod中的服务，Apiserver也可能会无法获取Pod的运行状态，产生一系列问题。 Pod与Pod之间网络不通讯，很有可能是网络组件产生了异常导致的。排查
2024年01月16日
浏览(10)
K8S node节点执行kubectl get pods报错
第一个问题是由第二个问题产生的，第二个问题也是最常见的网上找的都是从master节点把文件复制过来，这样确实可以解决，但是麻烦，有一个node节点还好，如果有多个呢？每个都复制吗？下面是我从外网上找的解决方法 (错误二中) ，超实用，且方便错误一：这个错误基
2024年04月15日
浏览(9)
K8S集群中PLEG问题排查
k8s集群排障真的很麻烦今天集群有同事找我，节点报 PLEG is not healthy 集群中有的节点出现了NotReady，这是什么原因呢？ PLEG is not healthy 也是一个经常出现的问题 POD 生命周期事件生成器先说下PLEG 这部分代码在kubelet 里，我们看一下在kubelet中的注释: 也就是说kubelet 会定时把
2024年02月02日
浏览(9)
K8s出现问题时，如何排查解决！
K8s问题的排查 1、POD启动异常、部分节点无法启动pod 容器里管理应用 pod出现异常的原因： 2. 审视集群状态审视集群状态 K8S的集群状态是排查故障的关键起点。使用kubectl get nodes命令来检查节点状态。如果有节点未能就绪或出现异常状态，可能会对应用程序造成故障。确保基
2024年02月02日
浏览(15)
【Kubernetes】当K8s出现问题时，从哪些方面可以排查
前言 kubernetes，简称K8s，是用8代替名字中间的8个字符“ubernete”而成的缩写。是一个开源的，用于管理云平台中多个主机上的容器化的应用，Kubernetes的目标是让部署容器化的应用简单并且高效（powerful）,Kubernetes提供了应用部署，规划，更新，维护的一种机制。 📕作者简介
2024年02月14日
浏览(10)
k8s排查Java应用CPU负载过高问题
因为k8s发布的pod还未加入资源的监控，在查看pod负载时发现其中pod占用1核CPU 2.1通过debug排查下一步可以到对应的node节点查看对应进程的信息，也可以通过debug在当前节点进行排查（当节点太多懒得登录过去时） top命令找到所在节点进程信息，找到问题进程查看详细线程通
2024年02月05日
浏览(10)
现场问题排查-k8s（docker）上某服务pod频繁自动重启
根因：应用内存占用不合理（个人认为）+现场配置内存不够导致频繁触发OOM引发该现象。为啥要写这个文章？之前没有k8s下pod频繁重启的问题处理经验，这次实战沉淀思路及过程，供后续自己处理相同问题提供参考资料为其他遇到类似问题的人提供一些排查思路现场反馈
2024年02月03日
浏览(7)