k8s节点NotReady问题处理

我把三台虚拟机重启，发现2个节点一直处于NotReady状态，便去查找问题，到最后是因为子节点的kubelet的状态异常了，restart一下就好了，下面转一下解决的思路昨天晚上，针对K8S环境做了一次压测，50路并发实施，早上起来看监控，发现昨晚8点之后，系统好像都宕掉了，一看master节点和一个node节点状态变成了not ready，主要定位手段如下：1. 查看master...

dalianpai

3218人浏览 · 2019-12-18 15:50:00

dalianpai · 2019-12-18 15:50:00 发布

我把三台虚拟机重启，发现2个节点一直处于NotReady状态，便去查找问题，到最后是因为子节点的kubelet的状态异常了，restart一下就好了，下面转一下解决的思路

昨天晚上，针对K8S环境做了一次压测，50路并发实施，早上起来看监控，发现昨晚8点之后，系统好像都宕掉了，一看master节点和一个node节点状态变成了not ready，主要定位手段如下：

1. 查看master kubelet状态

systemctl status kubelet 状态正常

2. 查看master kube-proxy状态

systemctl status kube-proxy 状态正常

3. 查看master kube-apiserver状态

systemctl status kube-apiserver 状态正常

4. 查看master kube-scheduler状态

systemctl status kube-scheduler 状态正常

5. 查看master etcd状态

systemctl status etcd 状态正常

6. 查看flannel状态

在kubernetes-dashboard上看到flannel挂掉了，查看日志如下

Failed create pod sandbox: rpc error: code = Unknown desc = failed to start sandbox container for pod "kube-flannel-ds-amd64-sc7sr": Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:301: running exec setns process for init caused \"signal: broken pipe\"": unknown

而这个问题，通过分析应该是flannel在网络比较大的情况下，内存资源不足了，所以修改flannel的配置，将内存扩大即可。

"resources": {
"limits": {
"cpu": "300m",
"memory": "200Mi"
},
"requests": {
"cpu": "300m",
"memory": "200Mi"
}
},

修改完成之后，需要重启docker，在删除原来的flannel pod，这样问题就解决拉
原文链接：https://blog.csdn.net/Viogs/article/details/96114776

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

深化产教融合协同创新，华为云HCSD校园沙龙走进山西职业技术学院

华为开发者空间

2024华为开发者盛典，海外开发者代表团走进华为

华为开发者空间

华为“行业AI应用创新孵化营”走进中国医科大学，共探人才培养新模式

华为开发者空间

所有评论(0)

查看更多评论

dalianpai

@qq_29860591

已为社区贡献17条内容