nvidia-smi命令解读
nvidia 的系统管理界面 (nvidia-smi),可以收集各种级别的信息,查看显存使用情况。此外, 可以启用和禁用 GPU 配置选项 (如 ECC 内存功能)。在实验室里大家共用显卡,每次跑代码前都看下GPU的使用状态。
解释相关参数含义:
- GPU:本机中的GPU编号
- Name:GPU 类型
- Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
- Fan:风扇转速
- Temp:温度,单位摄氏度
- Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能
- Pwr:Usage/Cap:能耗表示
- Bus-Id:涉及GPU总线的相关信息;
- Disp.A:Display Active,表示GPU的显示是否初始化
- Memory-Usage:显存使用率
- Volatile GPU-Util:浮动的GPU利用率
- Uncorr. ECC:关于ECC的东西
- Compute M.:计算模式
- Processes 显示每块GPU上每个进程所使用的显存情况