Kubernetes 节点 kubelet 错误处理:pleg 错误的应对策略
当kubelet出现pleg(Pod Lifecycle Event Generator)错误时,Kubernetes会对有问题的节点进行处理,具体处理方式取决于集群的配置和策略。\n\n1. 节点处理:Kubernetes会将节点标记为NotReady状态,并尝试重新启动kubelet进程。如果重启失败,Kubernetes可能会尝试重新启动整个节点或者将其从集群中删除(取决于配置)。\n\n2. Pod处理:当节点上的kubelet出现问题时,Kubernetes会尝试将Pod重新调度到其他可用的节点上。如果其他节点没有足够的资源来容纳这些Pod,或者没有其他可用节点,那么Pod将保持在Pending状态,直到节点恢复。\n\n3. 节点恢复后的处理:一旦节点恢复,kubelet会重新注册到集群中,并将节点标记为Ready状态。Kubernetes会重新调度挂起的Pod到恢复的节点上,使它们重新运行。\n\n需要注意的是,节点恢复后,kubelet可能会尝试重新启动之前失败的Pod,如果Pod的重启策略设置为Always,或者Pod的重启次数未超过最大重启次数。否则,如果Pod的重启策略为OnFailure或Never,并且Pod的重启次数已超过最大重启次数,那么Kubernetes将标记该Pod为失败,并可能触发相应的告警或通知。
原文地址: https://www.cveoy.top/t/topic/p33c 著作权归作者所有。请勿转载和采集!