现象:虚拟机卡死,在控制看到内核软死锁提示,报错截图如下:
在这里插入图片描述
解决办法:

设置为30s覆盖到配置文件中
echo 30 > /proc/sys/kernel/watchdog_thresh 

查看
 tail -1 /proc/sys/kernel/watchdog_thresh
30

临时生效
sysctl -w kernel.watchdog_thresh=30

常见原因:
1>服务器电源供电不足,导致CPU电压不稳导致CPU死锁
2>vcpus超过物理cpu实际核数
3>虚机所在的宿主机的CPU负载较高或磁盘IO太高
4>虚机CPU负载较高或磁盘IO太高
5>VM网卡驱动存在bug,处理高水位流量时存在bug导致CPU死锁
6>BIOS开启了超频,导致超频时电压不稳,容易出现CPU死锁

本次出现的原因是:
因为开启多台虚拟机vcpu数量超过实际物理核数,同时虚拟机作为NFS 服务端磁盘IO也比较高

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐