【docker踩坑】记一次CPU100%，内存96%问题排查

服务中的应用全部通过docker的方式进行部署，部署的应用有mysql、redis、zookeeper、kafka、elasticsearch、tomcat。，过几秒，这个java进程就会消失，同时cpu会降到正常水平，再过几秒会出现另一个高占用率的java进程。：将elasticsearch启动后，cpu突然飙升到100%，内存飙升到96%，见下图阿里云控制台截图。，将进程按照cpu使用率进行排

不做大哥好多年了

5306人浏览 · 2022-08-02 22:20:53

不做大哥好多年了 · 2022-08-02 22:20:53 发布

背景：服务中的应用全部通过docker的方式进行部署，部署的应用有mysql、redis、zookeeper、kafka、elasticsearch、tomcat
问题：将elasticsearch启动后，cpu突然飙升到100%，内存飙升到96%，见下图阿里云控制台截图

排查过程：① 使用top命令，按P，将进程按照cpu使用率进行排序，发现是某个java进程占用96.3%的cpu。但是，过几秒，这个java进程就会消失，同时cpu会降到正常水平，再过几秒会出现另一个高占用率的java进程。导致无法按照传统的方式进行排查。

② 由于所有应用都是使用docker部署的，所以考虑使用docker stats命令排查。发现es应用的cpu使用率变化非常剧烈，0 % 或 93%。通过docker logs -f c_es命令，查看c_es的日志，发现es在不断地重启。将c_es停掉，问题得到解决。

问题出现原因：在创建c_es服务器时，使用了–restart=always 参数，意味着容器如果退出，会一直重启。如果启动容器时都失败了，那么会进入失败-重启这个死循环。因此，–restart=always参数应该谨慎使用。

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

基于仓颉编程语言+DeepSeek实现智能聊天助手开发秘籍

华为开发者空间

华为云Tokens服务全面接入384超节点，以“大杂烩”优势打造先进算力

华为开发者空间

云闪付联合HarmonyOS SDK打造更便捷安全的支付体验

（Scan Kit），作为软硬协同的系统级扫码服务，Scan Kit应用了多项计算机视觉和AI技术，不仅实现了远距离自动扫码，同时还对各种复杂扫码场景（如暗光、污损、模糊、小角度、曲面码等）做了识别优化。比如扫码时，云闪付可以选择二维码的图片识别，减少用户找二维码的时间。云闪付是由各商业银行、产业各方与中国银联共建共享的移动支付产品，通过聚合银行业资源与银联广阔网络，覆盖更广阔的服务场景，如商超、