Kubernetes集群可能存在的问题
基础架构守护程序问题: NTP服务关闭
硬件问题:CPU,内存或磁盘损坏 内核问题:内核死锁,文件系统损坏
容器运行时问题:运行时守护程序无响应

当Kubernetes中节点发生上述问题,在整个集群中,k8s服务组件并不会感知以上问题,就会导致pod仍会调度至问题节点。

Node-problem-detector
为了解决这个问题,社区引入了守护进程node-problem-detector,从各个守护进程收集节点问题,并使它们对上游层可见。

Kubernetes节点诊断的工具,可以将节点的异常,例如:

Runtime无响应;
Linux kernel无响应;
网络异常 ;
文件描述符异常;
硬件问题如cpu,内存或者磁盘故障。
故障分类

问题汇报手段
Node-problem-detector通过设置NodeCondition或者创建event对象来汇报问题。

NodeCondition: 针对永久性故障,会通过NodeCondition来改变节点状态
Event:临时故障通过event来提醒相关对象,比如通过当前节点运行的所有pod。

原文地址:http://www.cnblogs.com/gaoyuechen/p/16847722.html

1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长! 2. 分享目的仅供大家学习和交流,请务用于商业用途! 3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入! 4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需! 7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员! 8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载 声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性