T4 GPU设备显示异常
更新时间 2025-08-05 10:04:41
最近更新时间: 2025-08-05 10:04:41
本文向您介绍如何解决T4 GPU设备显示异常的问题。
山西省政府与故宫博物院签署合作框架协议
百度 本期凰家学堂针对这一热点话题,与三位特邀嘉宾:青岛市市南区实验小学校长朱雪梅、青岛嘉峪关学校校长刘群、青岛镇江路小学校长张晓迎围绕三点半的课后教育,共同探讨如何在新的教育环境下,通过家长与学校的共同联合努力,为每一个孩子提供适合其自身与家庭环境的课后教育。G6型或PI2型规格的GPU弹性云主机中,执行nvidia-smi命令查看GPU设备状态或使用情况时,有如下问题:
- 单卡GPU弹性云主机上,报错“No devices were found”。
- 多卡GPU弹性云主机上显示卡数目不全,执行“lspci|grep -i nvidia“显示GPU卡数目正常。
可能原因
NVIDIA Tesla T4 GPU默认使用并开启GSP Firmware,导致GPU无法识别。
处理方法
-
执行以下命令,移除NVIDIA内核模块。
rmmod nvidia_drm rmmod nvidi_modeset rmmod nvidia
-
执行以下命令,关闭GSP Firmware开关,并载入NVIDIA内核模块。
modprobe nvidia NVreg_EnableGpuFirmware=0 modprobe nvidia_drm modprobe nvidia_modeset
以上操作只对当前运行的系统生效。如需持久化设置,需要在配置文件/etc/modprobe.d/nvidia.conf中增加一行“options nvidia NVreg_EnableGpuFirmware=0“。
- 如果问题依然存在,请联系客服,由技术支持人员处理。