Openstack-I版计算节点:Nova/Neutron/Ceilometer服务不断重启

问题现象:
某台生产环境计算节点连续不断发出服务重启告警邮件,但服务器上的虚拟机并没有受到影响,开始怀疑是监控误报。最终登录物理机服务器上查看系统运行情况。
这里写图片描述
可以看到物理服务器存在一个僵尸进程,同时负载有点高。所以着手第一步解决掉僵尸进程。

处理过程:
1、找到僵尸进程
ps -A -ostat,ppid,pid,cmd | grep -e ‘^[Zz]’
这里写图片描述
可以看到,僵尸进程查找到了
2、尝试杀掉僵尸进程
kill -HUP 62276
多次执行,发现并不好使。越来越刺激了!

解决办法:
僵尸进程杀不掉,物理服务器负载高。同时Nova-compute的日志和libvirtd的日志中有告警和报错信息:
Nova-compute告警信息:
WARNING nova.virt.libvirt.driver [-] couldn’t obtain the vpu count from domain id: 26, exception: cannot get CPU affinity of process 62328: No such process
libvirtd错误信息:
error : virProcessGetAffinity:433 : cannot get CPU affinity of process 62328: No such process

最后没办法了,重启物理机再观察问题是否会出现。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐