一台服务器毕竟很多人都在用,这个时候查看GPU状态显得尤为重要(查看剩余显存大小,以便自己能否使用这块卡)

后来查找发现有2种方式,最开始我用的就是第一种,但是显然不是很好用,最后发现gpustat超级好用,下面分别介绍两种用法

一、nvidia-smi

nvidia-smi是 Nvidia 显卡命令行管理套件,基于 NVML 库,旨在管理和监控 Nvidia GPU 设备。

下面是 nvidia-smi 命令的输出,其中最重要的两个指标:

显存占用
GPU 利用率
显存占用和 GPU 利用率是两个不一样的东西,显卡是由 GPU 计算单元和显存等组成的,显存和 GPU 的关系有点类似于内存和 CPU 的关系。

nvidia-smi

在这里插入图片描述

实时监测

watch -n 1 nvidia-smi

在这里插入图片描述

二、gpustat

gpustat, 直接 pip install gpustat 即可安装,gpustat 基于nvidia-smi,可以提供更美观简洁的展示,结合 watch 命令,可以动态实时监控 GPU 的使用情况。

gpustat -i

在这里插入图片描述

watch --color -n 1 gpustat -cpu

在这里插入图片描述

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐