【博客694】k8s kubelet 状态更新机制-Toy模板网

这篇具有很好参考价值的文章主要介绍了【博客694】k8s kubelet 状态更新机制。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

k8s kubelet 状态更新机制

场景：

当 Kubernetes 中 Node 节点出现状态异常的情况下，节点上的 Pod 会被重新调度到其他节点上去，但是有的时候我们会发现节点 Down 掉以后，Pod 并不会立即触发重新调度，这实际上就是和 Kubelet 的状态更新机制密切相关的，Kubernetes 提供了一些参数配置来触发重新调度的时间

kubelet 状态更新的基本流程：

1、kubelet 自身会定期更新状态到 apiserver，通过参数–node-status-update-frequency指定上报频率，默认是 10s 上报一次。
2、kube-controller-manager 会每隔–node-monitor-period时间去检查 kubelet 的状态，默认是 5s。
3、当 node 失联一段时间后，kubernetes 判定 node 为 notready 状态，这段时长通过–node-monitor-grace-period参数配置，默认 40s。
4、当 node 失联一段时间后，kubernetes 判定 node 为 unhealthy 状态，这段时长通过–node-startup-grace-period参数配置，默认 1m0s。
5、当 node 失联一段时间后，kubernetes 开始删除原 node 上的 pod，这段时长是通过–pod-eviction-timeout参数配置，默认 5m0s。

kube-controller-manager 和 kubelet 是异步工作的，这意味着延迟可能包括任何的网络延迟、apiserver 的延迟、etcd 延迟，一个节点上的负载引起的延迟等等。因此，如果–node-status-update-frequency设置为 5s，那么实际上 etcd 中的数据变化会需要 6-7s，甚至更长时间。

注意：

kubelet 在更新状态失败时，会进行nodeStatusUpdateRetry次重试，默认为 5 次。
kubelet 会在函数tryUpdateNodeStatus中尝试进行状态更新。Kubelet 使用了 Golang 中的http.Client()方法，但是没有指定超时时间，因此，如果 API Server 过载时，当建立 TCP 连接时可能会出现一些故障。
因此，在nodeStatusUpdateRetry * --node-status-update-frequency时间后才会更新一次节点状态。
同时，Kubernetes 的 controller manager 将尝试每–node-monitor-period时间周期内检查nodeStatusUpdateRetry次。在–node-monitor-grace-period之后，会认为节点 unhealthy，然后会在–pod-eviction-timeout后删除 Pod。
kube proxy 有一个 watcher API，一旦 Pod 被驱逐了，kube proxy 将会通知更新节点的 iptables 规则，将 Pod 从 Service 的 Endpoints 中移除，这样就不会访问到来自故障节点的 Pod 了。

如何配置：

对于这些参数的配置，需要根据不通的集群规模场景来进行配置。

社区默认的配置：