基本是follow下面教程修复的
nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及避坑解决方案_打拳的土豆的博客-CSDN博客
1 背景分析:
可能是由于断电重启造成的
当再次跑实验时,发现cuda不可用,于是输入“nvidia-smi”才发现了一个错误,如下:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver
这是由于重启机器,linux内核升级导致的,由于linux内核升级,之前的Nvidia驱动就不匹配连接了,但是此时Nvidia驱动还在,可以通过命令 nvcc -V 找到答案。、
2,安装dkms:
sudo apt-get install dkms
3,查看本机连接不上的驱动版本:
ls -l /usr/src/
可以看到有一个nvidia的文件,我这里是 nvidia-470.94
4 使用dkms重新安装适合驱动:
sudo dkms install -m nvidia -v 470.103.01
这条命令 -v 后面需要填写本机的nvidia驱动版本,根据第3步得到
到了这里,如果安装成功,此时输入nvidia-smi就会成功连接了
文章来源地址https://www.toymoban.com/news/detail-486994.html文章来源:https://www.toymoban.com/news/detail-486994.html
到了这里,关于nvidia-smi报错(已解决):NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!