我们团队新开源了一个让 Kubernetes 在节点断电情况下 Service 后端 Pod 健康状态依然能快速更新的组件。
Kubernetes 自带的健康检查依赖 kubelet 对 Pod 进行探测,但是断电的情况下 kubelet 自己就没了,无法更新 Pod 的状态,默认要等上几分钟才会把 Pod 状态设置为 unknown,这期间访问 Service 的流量都会出现问题。
我们通过外部的一个探测器辅助 Pod 状态更新,这样即使节点断电也能快速去更新 Pod 的状态,避免长时间的访问错误。
https://github.com/kubeovn/endpoint-health-checker
Kubernetes 自带的健康检查依赖 kubelet 对 Pod 进行探测,但是断电的情况下 kubelet 自己就没了,无法更新 Pod 的状态,默认要等上几分钟才会把 Pod 状态设置为 unknown,这期间访问 Service 的流量都会出现问题。
我们通过外部的一个探测器辅助 Pod 状态更新,这样即使节点断电也能快速去更新 Pod 的状态,避免长时间的访问错误。
https://github.com/kubeovn/endpoint-health-checker