NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver解决办法

这篇具有很好参考价值的文章主要介绍了NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver解决办法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver解决办法

参考链接1
参考链接2
参考链接3

2023.3.17更新

今天突然又出现这个问题,一开始我就以为内核自动更新,便想去降低内核版本,一看旧版本的内核,发现都被自动删除了,然后我之前也将内核自动更新取消了啊,输入命令dpkg --get-selections | grep linux-image打印内核版本显示也是hold,按道理内核并没有更新。
nvidia-smi has failed because it couldn't communicate with the nvidia driver,环境配置,linux,服务器,ubuntu
一开始没发现问题,便一直尝试下载旧版本内核来解决,一直没成功。最后无意间在ubuntu的应用中点开nvidia x server settings

nvidia-smi has failed because it couldn't communicate with the nvidia driver,环境配置,linux,服务器,ubuntu
将选择nvidia on-demand,再重启系统就可以了(原来选项选的是intel 省电模式,太坑了。。。)

nvidia-smi has failed because it couldn't communicate with the nvidia driver,环境配置,linux,服务器,ubuntu

1. 问题描述

终端输入nvidia-smi报错

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.

本来好好的,突然出现这个问题一般是内核自动更新,导致内核版本与显卡驱动不匹配的问题,解决办法最好是把内核版本降到之前的版本

  • 终端输入命令uname -r,输出当前内核版本,记住当前版本信息
2.切换到原来的内核

(1)如果ubuntu有图形化界面,则可以通过以下方法切换内核

  • 重启主机,进入grub引导界面,选择Advanced options for Ubuntu

nvidia-smi has failed because it couldn't communicate with the nvidia driver,环境配置,linux,服务器,ubuntu

  • 选择Advanced options for Ubuntu后,进入其子菜单,如下图所示

nvidia-smi has failed because it couldn't communicate with the nvidia driver,环境配置,linux,服务器,ubuntu

  • 选择一个低版本的内核进入系统,然后通过终端输入uname -r查看当前内核版本确认是否切换成功,若切换成功则输入nvidia-smi查看显卡配置能否打印

(2)如果ubuntu没有图形化界面(远程控制的服务器那种),则可以通过以下方法切换内核

  • 首先,查看自己的grub版本:
grub-install --version

记住(GRUB)之后的大版本是2.00以后还是2.00以前

  • 查看自己现有的内核版本(完全版)
grep 'menuentry' /boot/grub/grub.cfg
  • 找到自己想换回的内核
例如,这里我想要更换为5.8.0-50,就找到对应的选项,有
menuentry 'Ubuntu,Linux 5.8.0-50-generic' --class ubuntu 
--class gnu-linux --class gnu --class os $menuentry_id_option 
'gnulinux-5.8.0-50-generic-advanced-237310b8-5d8a-4e13-bcbd-37ef97be8341' {

这一选项,注意不是(recovery mode).

  • 复制上面信息中menuentry之后的单引号内的字符串

比如我是Ubuntu,Linux 5.8.0-50-generic

  • 修改grub

在终端中输入

sudo nano /etc/default/grub

将第一个

GRUB_DEFAULT=0

修改为刚才复制的内容

GRUB_DEFAULT = "Ubuntu,Linux 5.8.0-50-generic"

(注意要加双引号)

  • 更新grub设置

在终端中输入

sudo update-grub

如果看到有下面警告

Please don't use old title 'Ubuntu,Linux 5.8.0-50-generic' 	for GRUB_DEFAULT,
 use 'Advanced options for Ubuntu>Ubuntu,Linux 5.8.0-50-generic' 
 (for versions before 2.00) or 
 'gnulinux-advanced-237310b8-5d8a-4e13-bcbd-37ef97be8341>gnulinux-5.8.0-50-generic-
 advanced-237310b8-5d8a-4e13-bcbd-37ef97be8341' (for 2.00 or later)

则根据之前看到的grub版本,如果大于等于2.00,则把上面第三个单引号内的字符串复制粘贴.否则把第二个单引号内的字符串复制粘贴,也就是说一定要重新修改一次grub

例如我的grub版本大于2.00,则再次将之前的

GRUB_DEFAULT="Ubuntu,Linux 5.8.0-50-generic"

修改为

GRUB_DEFAULT="gnulinux-advanced-237310b8-5d8a-4e13-bcbd-
37ef97be8341>gnulinux-5.8.0-50-generic-
	 advanced-237310b8-5d8a-4e13-bcbd-37ef97be8341"`

否则修改为

GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu,Linux 5.8.0-50-generic"

一定要再次修改一次GRUB_DEFAULT!!!注意看清楚是第二个单引号和第三个单引号内的内容!!!

  • 再次在终端中输入
sudo update-grub

此时不应再看到任何警告提示

  • 重新启动
sudo reboot

注意,此时grub引导时光标默认指向的应该是Ubuntu高级选项之类的选项,不要移动光标,让它自动选择启动

  • 查看是否成功
uname -r

如果已经变成你想要改的内核版本,则继续,否则检查是否忘了sudo update-grub或者grub修改错误

3.删除更新的内核
  • 查看当前的所有已安装的内核
dpkg --get-selections | grep linux-image

输出

linux-image-5.10.0-1023-oem             install
linux-image-5.4.0-42-generic			install
linux-image-5.8.0-50-generic			install
linux-image-generic-hwe-20.04			install

找到更新后的内核名字(一开始记住的内核版本信息),删除该内核

sudo apt-get remove linux-image-5.10.0-1023-oem
sudo dpkg -P linux-image-5.10.0-1023-oem

最后别忘记修改/etc/default/grub的GRUB_DEFAULT为=0,以及sudo update-grub(如果是采用第二种切换内核的方法才需要,第一种不需要)

4.禁止内核自动更新
  • 基于命令行修改配置文件

(1)输入:

sudo gedit /etc/apt/apt.conf.d/10periodic

如果要禁止自动更新配置文件设为如下:

APT::Periodic::Update-Package-Lists "0";
APT::Periodic::Download-Upgradeable-Packages "0";
APT::Periodic::AutocleanInterval "0";
APT::Periodic::Unattended-Upgrade "0";

如果要打开自动更新配置文件设为如下:

APT::Periodic::Update-Package-Lists "2";
APT::Periodic::Download-Upgradeable-Packages "1";
APT::Periodic::AutocleanInterval "0";
APT::Periodic::Unattended-Upgrade "1";

保存退出。

(2)输入:

sudo gedit /etc/apt/apt.conf.d/20auto-upgrades

如果要禁止自动更新配置文件设为如下:

APT::Periodic::Update-Package-Lists "0";
APT::Periodic::Download-Upgradeable-Packages "0";
APT::Periodic::AutocleanInterval "0";
APT::Periodic::Unattended-Upgrade "0";

如果要打开自动更新配置文件设为如下:

APT::Periodic::Update-Package-Lists "2";
APT::Periodic::Download-Upgradeable-Packages "1";
APT::Periodic::AutocleanInterval "0";
APT::Periodic::Unattended-Upgrade "1";

保存退出。

  • 打开“Software & Updates(软件和更新)

更新选项卡修改为

nvidia-smi has failed because it couldn't communicate with the nvidia driver,环境配置,linux,服务器,ubuntu

  • ubuntu默认启动了自动更新内核,为了避免出现重启系统后遇到错误进入不到系统中去,我们可以进一步关闭内核更新,使用当前内核。
sudo apt-mark hold linux-image-generic linux-headers-generic 

如果要重启启动内核更新:文章来源地址https://www.toymoban.com/news/detail-782134.html

sudo apt-mark unhold linux-image-generic linux-headers-generic

到了这里,关于NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver解决办法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 在docker里使用gpu的解决方案(镜像内安装驱动使用nvidia-smi后显示Failed to initialize NVML: Driver/library version mismatch)

    要么在docker环境内安装nvidia-driver 但容易和外面的版本不一致导致各种报错version mismatch之类的 不如使用nvidia-docker,这是一个nVidia官方为了方便在docker镜像容器内使用gpu做的包: 1. 保证docker环境内没有nvidia驱动程序,防止后续配置出现驱动版本不一致的情况         找到你要

    2024年01月21日
    浏览(41)
  • 【nvidia-smi:command not found】如何在集群服务器上使用nvidia-smi查看GPU信息

    1. nvidia-smi指令输出分析 对于普通的多卡服务器,nvidia-smi命令可以显示有关 NVIDIA 显卡和 GPU 的详细信息,如输入 得到以下输出,可以看到相应的CUDA版本,GPU显存大小等信息。 2. 集群上使用nvidia-smi指令 如果登录了服务器后,直接在命令行中输入nvidia-smi,会有如下报错: b

    2024年02月10日
    浏览(51)
  • The operation couldn’t be completed. Unable to launch com.xxx because it has an invalid code signatu

    通过Xcode跑app到真机上出现错误 手机弹窗提示:“需要互联网连接以验证是否信任开发者“xxx”。此App在验证前将不可用” Xcode提示: The operation couldn’t be completed. Unable to launch com.xxx because it has an invalid code signature, inadequate entitlements or its profile has not been explicitly trusted by th

    2024年02月12日
    浏览(42)
  • Linux | nvidia-smi 命令使用记录

    参考文章链接:https://blog.csdn.net/weixin_44966641/article/details/121228579 nvidia smi(也称为NVSMI)为来自 Fermi 和更高体系结构系列的 nvidia Tesla、Quadro、GRID 和 GeForce 设备提供监控和管理功能。GeForce Titan系列设备支持大多数功能,为GeForce品牌的其余部分提供的信息非常有限。NVSMI是一种

    2024年02月02日
    浏览(41)
  • nvidia/cuda doker容器使用nvidia-smi不能找到命令

    参考资料 NVIDIA官方安装文档 CSDN博客 运行环境 wsl子系统Ubuntu 20.04 docker19.03以上 问题:使用docker pull nvidia/cuda:11.4.2-cudnn8-runtime-rockylinux8 在容器中使用nVidia-smi 出现命令无法找到的问题 百度好久,看了几篇文章,最后发现运行cuda的容器不支持调用主机的显卡,需要下载nvidia-

    2023年04月08日
    浏览(40)
  • 矩池云上使用nvidia-smi命令教程

    nvidia-smi全称是NVIDIA System Management Interface ,它是一个基于NVIDIA Management Library(NVML)构建的命令行实用工具,旨在帮助管理和监控NVIDIA GPU设备。 接下来我介绍一下,用nvidia-smi命令来查询机器GPU使用情况的相关内容。​ 我以上图的查询内容为例,已经复制出来了,如下, 我们来

    2024年02月16日
    浏览(38)
  • 一次必搞定Ubuntu上安装nvidia驱动教程--nvidia-smi

    Nvidia官网 (https://www.nvidia.cn/) Nvidia驱动下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn NVIDIA显卡驱动可以通过如下指令删除以前安装的NVIDIA驱动版本,重新安装。 注意!在安装NVIDIA驱动以前需要禁止系统自带显卡驱动nouveau:可以先通过指令lsmod | grep nouveau查看nouveau驱动的启

    2024年02月17日
    浏览(34)
  • 深度学习烦人的基础知识(2)---Nvidia-smi功率低,util高---nvidia_smi参数详解

    如下图所示,GPU功率很低,Util占用率高。 这个训练时不正常的! Pwr是指GPU运行时耗电情况,如图中GPU满载是300W,目前是86W与GPU2的空载情况功率相等。说明GPU没有在真正运行。 GPU-Util高说明它的核心被占用了,占用率为100%。 打个比方,把GPU看做是人。三个人,一个在举重,

    2024年01月16日
    浏览(33)
  • Ubuntu下nvidia-smi失败,使用dkms解决

    nvidia-smi显示无法与驱动通讯 一般来说是因为机器重启linux内核自动更新导致,可以尝试回退内核版本,或者使用dkms安装该内核下驱动配套的包,这里主要介绍使用dkms如何处理 查看已安装的nvidia驱动版本 显示 说明我电脑上nvidia驱动的版本是nvidia-525.116.04 安装dkms和相关包 安

    2024年02月13日
    浏览(32)
  • nvidia-smi no devices were found

    报错:找不到设备 输入 发现显卡其实还在 用NVIDIA-Linux-x86_64-xxx.xxx.run重装了一下显卡驱动,发现还是不行 最后用了另一种安装方式 选择一个 比如选择了525,那就是 安装完了其实还是找不到设备,所以需要重启 然后就好了 参考 https://blog.csdn.net/dujianghai/article/details/125760522

    2024年02月15日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包