ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

kubernetes主控节点宕机重启,导致kubelet不可用

2020-03-27 16:55:10  阅读:430  来源: 互联网

标签:hdss7 uptime 21 kubernetes 宕机 22 主控 kube root


  一台k8s主控节点失去远程连接,重新连接后,发现服务器运行时间变短。另外一台主控节点的运行时间是18天,怀疑这台机器宕机重启了。

[root@hdss7-21 ~]# uptime 
 15:56:20 up 22:01,  1 user,  load average: 0.38, 0.35, 0.41

  检查集群运行状态:

[root@hdss7-21 ~]# kubectl get cs
NAME                 STATUS    MESSAGE              ERROR
scheduler            Healthy   ok                   
controller-manager   Healthy   ok                   
etcd-1               Healthy   {"health": "true"}   
etcd-0               Healthy   {"health": "true"}   
etcd-2               Healthy   {"health": "true"}   
[root@hdss7-21 ~]# kubectl get node
NAME                STATUS     ROLES         AGE   VERSION
hdss7-21.host.com   NotReady   master,node   9d    v1.15.2
hdss7-22.host.com   Ready      master,node   9d    v1.15.2
[root@hdss7-21 ~]# kubectl get pods
NAME             READY   STATUS    RESTARTS   AGE
nginx-ds-bwtkl   1/1     Running   0          6d
nginx-ds-kvhsv   1/1     Running   0          6d

  上面的命令输出结果,显示node节点有问题。

  发现docker没有启动,重启docker:

[root@hdss7-21 ~]# systemctl status docker
* docker.service - Docker Application Container Engine
   Loaded: loaded (/usr/lib/systemd/system/docker.service; disabled; vendor preset: disabled)
   Active: inactive (dead)
     Docs: https://docs.docker.com
[root@hdss7-21 ~]# systemctl start docker

  supervisor的显示也异常:

[root@hdss7-21 ~]# supervisorctl status
etcd-server-7-21                 RUNNING   pid 4008, uptime 22:05:21
kube-apiserver-7-21              RUNNING   pid 4021, uptime 22:05:21
kube-controller-manager-7-21     RUNNING   pid 4024, uptime 22:05:21
kube-kubelet-7-21                FATAL     Exited too quickly (process log may have details)
kube-proxy-7-21                  RUNNING   pid 4028, uptime 22:05:21
kube-scheduler-7-21              RUNNING   pid 4032, uptime 22:05:21

  使用supervisor把kubelet启动:

[root@hdss7-21 ~]# supervisorctl stop kube-kubelet-7-21
kube-kubelet-7-21: ERROR (not running)
[root@hdss7-21 ~]# supervisorctl start kube-kubelet-7-21
kube-kubelet-7-21: started

  k8s集群恢复正常:

[root@hdss7-21 ~]# supervisorctl status
etcd-server-7-21                 RUNNING   pid 4008, uptime 22:14:00
kube-apiserver-7-21              RUNNING   pid 4021, uptime 22:14:00
kube-controller-manager-7-21     RUNNING   pid 4024, uptime 22:14:00
kube-kubelet-7-21                RUNNING   pid 126981, uptime 0:00:40
kube-proxy-7-21                  RUNNING   pid 4028, uptime 22:14:00
kube-scheduler-7-21              RUNNING   pid 4032, uptime 22:14:00
[root@hdss7-21 ~]# kubectl get node
NAME                STATUS   ROLES         AGE   VERSION
hdss7-21.host.com   Ready    master,node   9d    v1.15.2
hdss7-22.host.com   Ready    master,node   9d    v1.15.2


  学习k8s,老男孩教育的王导值得拥有。

  supervisor的原理不太懂,但先搞定问题再说。

标签:hdss7,uptime,21,kubernetes,宕机,22,主控,kube,root
来源: https://blog.51cto.com/gagarin/2482486

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有