docker容器挂了,显卡驱动异常问题:nvidia-container-cli: initialization error: nvml error: driver not loaded...

这篇具有很好参考价值的文章主要介绍了docker容器挂了,显卡驱动异常问题:nvidia-container-cli: initialization error: nvml error: driver not loaded...。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

docker容器起不来,Nvidia驱动相关问题

1.具体报错
nvidia-container-cli报错,修电脑笔记,ubuntu,linux,运维,docker

Error response from daemon: OCI runtime create failed: container_linux.go:380: starting container process caused: process_linux.go:545: container init caused: Running hook #0:: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: initialization error: nvml error: driver not loaded: unknown
Error: failed to start containers: xxxxxxxxx
xxx@xxx:~$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

2.问题分析
容器依赖于Nvidia显卡驱动,驱动掉了。
题外话:该客户的服务器长年有外网,显卡驱动在这几个月不止一次掉,排查原因Linux/Ubuntu内核自动更新,驱动程序失效,重装驱动往往是一个解决办法,但是内核一旦再次更新,可能还是会导致显卡驱动失效。

3.解决办法
关闭内核自动更新
将下面两个配置文件里的值全改为“0”,保存后重启

xxxx@xxxx:/xxxxxx/xxxxxxxxxxx/xxxxx$ uname -r
5.15.0-58-generic
xxxx@xxxx:/xxxxxx/xxxxxxxxxxx/xxxxx$ cat /etc/apt/apt.conf.d/10periodic
#把下面值全改为“0”
APT::Periodic::Update-Package-Lists "0";
APT::Periodic::Download-Upgradeable-Packages "0";
APT::Periodic::AutocleanInterval "0";
   
xxxx@xxxx:/xxxxxx/xxxxxxxxxxx/xxxxx$ cat /etc/apt/apt.conf.d/20auto-upgrades 
#把下面值全改为“0”
APT::Periodic::Update-Package-Lists "0";
APT::Periodic::Unattended-Upgrade "0";

xxxx@xxxx:/xxxxxx/xxxxxxxxxxx/xxxxx$ sudo vim /etc/apt/apt.conf.d/10periodic 
xxxx@xxxx:/xxxxxx/xxxxxxxxxxx/xxxxx$ sudo vim /etc/apt/apt.conf.d/20auto-upgrades 
xxxx@xxxx:/xxxxxx/xxxxxxxxxxx/xxxxx$ sudo reboot -i

然后重装驱动,装好之后发现容器能起来,容器外可以nvidia-smi, 但是容器内不行,程序也跑不了

RuntimeError: No CUDA GPUs are available
(xxxxai) root@xxxxxx:/workspace/projects/xxxxx/xxxxai/xxxxx# nvidia-smi
No devices were found

重启一下docker服务

 systemctl restart docker 

OK,运行正常!


有一位大佬说可以“可以安装带有 dkms 选项的驱动程序”,我没测试,大家也可以参考一下:https://blog.csdn.net/wtlll/article/details/126541686文章来源地址https://www.toymoban.com/news/detail-524740.html

到了这里,关于docker容器挂了,显卡驱动异常问题:nvidia-container-cli: initialization error: nvml error: driver not loaded...的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Ubuntu20.04安装显卡驱动以及双屏幕显示问题

    最近由于学习需要,重新安装显卡驱动,这里仅仅记录以下本人安装过程中遇到的 一些问题 以及个人的参考文章之后的实际可行的 解决方案 ,请读者根据自身的实际情况酌情参考。 本人使用的是 华硕飞行堡垒6笔记本 ,显卡为 GTX1050Ti ,图形化界面显示使用的默认的 gdm3

    2024年02月04日
    浏览(30)
  • Linux Ubuntu18.04安装显卡驱动后,无法上网的问题解决

    由于跑程序需要,在Ubuntu18.04(双系统)上面安装nvidia显卡驱动, (我安装的是按照这个博客的教程来的:Ubuntu 18.04 安装NVIDIA显卡驱动+cuda 10.2+cudnn_ubuntu18.04安装cuda10.2_翟羽嚄的博客-CSDN博客安装了 nvidia-driver-470.161.03这个版本 ) 之后按照教程进行重启操作,然而重启后发现,

    2024年02月09日
    浏览(49)
  • 双系统电脑从window切换到ubuntu,外接显示屏用不了了(显卡驱动问题,降低驱动解决)

    昨天晚上(2月14号),我将电脑切换到ubuntu系统,发现我的外接显示屏用不了了。同时还弹出了软件更新窗口,于是我把更新窗口关掉了,执行了 sudo apt update sudo apt-get upgrade -y ,但是外接显示屏依然用不了 nvidia驱动出现了问题(具体原因不明) linux内核与nvidia驱动不匹配(

    2024年02月09日
    浏览(42)
  • 联想拯救者屏幕亮度无法调节,监视器和显卡驱动问题,经过多种测试

    1,设备管理器中的监视器部分 2,设备管理器的显卡适配器部分 自己拆一下机器加装固态,但这种感觉不应该导致问题。但导致这种问题的原因可能是装固态时候把电池拔了。 更新显卡驱动;禁止和启动集成显卡;卸载监视器 regedit,找到HKEY_LOCAL_MACHINESYSTEMControlSet001Cont

    2024年02月09日
    浏览(53)
  • Ubuntu 20.04-NVIDIA显卡驱动-安装和卸载-解决黑屏问题

    202300704更新,黑屏问题主要由linux内核更新导致 20230706 22:46 更新:好像这一步也没有用!!! The PCI ID Repository可以按照十六进制数字代码找到相应的显卡型号。 按照显卡型号下载驱动 (ctrl+鼠标点击-》跳转)下载官网建议的.run文件,下载完成后移动到主目录。 推荐直接在ub

    2024年02月12日
    浏览(60)
  • Ubuntu服务器安装Nvidia显卡驱动各类失败问题的解决方案集合

    给实验室服务器安装显卡驱动,总是遇到各种各样的问题。故而专门开一个文章记录一下遇到的各类问题。 在这里安装CUDA,选择最新版本后根据系统配置点选即可,会自动生成对应的链接,如下图。这里选runfile,里面打包好了所需的软件。直接装CUDA一是实验室跑AI算法需要

    2024年02月05日
    浏览(35)
  • 最新版ubuntu22.04安装NVIDIA显卡驱动以及CUDA、CUDNN,和安装驱动gcc版本问题解决。

    1.驱动安装参考下述链接 1.1 NVIDIA显卡驱动、 CUDA 的安装参考这个博主的具体安装步骤,但是最后一步的 cudnn 的安装参考另一个博主,见链接。 1.2 可以选择最新版本的驱动,需要在官网去找最新的版本对应。 2.最新版本我遇到的错误以及解决方法 2.1.在进入tty1界面后ubuntu安装

    2024年04月24日
    浏览(40)
  • 彻底解决安装了显卡驱动后,Ubuntu开机无法进入图形化界面、黑屏、左上角光标闪烁问题

    众所周知,Linux 系统的的 GUI 和 NVIDIA 显卡相处得并不是很愉快,驱动安装起来会出各种问题,非常折腾。很多同学在配备 NVIDIA 显卡的 Ubuntu 物理机上安装完显卡驱动后,重启电脑发现进不去图形化界面了。具体表现为系统黑屏,屏幕左上角一直有光标在不断闪烁,出现这种

    2024年02月12日
    浏览(82)
  • 【联想PC win11系统安装Ubuntu18.04/Ubuntu20.04】全程记录安装过程,和网卡驱动、显卡驱动等安装以及后续一系列问题

    电脑为联想台式机:Lenovo IdeaCentre-GeekPro 内存:32G 磁盘:512G固态硬盘+2T机械硬盘 CPU:i7-12700 GPU:NVIDIA RTX3060 学习需要安装Ubuntu18.04和win11系统共存。 之前装过Ubuntu16.04因为内核版本太老,显卡、声卡、有线无线网卡、蓝牙驱动都没有…,直接一个毛坯房了属于是,没有显卡驱

    2024年02月04日
    浏览(81)
  • linux(centos7)离线安装A100显卡驱动cuda/cudnn 以及解决docker not select device driver...gpu

    1.确认GPU型号和操作系统版本,本示例中以A100以及操作系统为Centos 7.9进行操作。 准备GPU驱动和CUDA 11.2软件包,在nvidia官网进行驱动包和CUDA包下载 链接: link linux系统均选择 Linux 64-bit CUDA Toolkit选择最新版本 如您需要老版本CUDA,请前往老版本CUDA下载 本示例中使用CUDA 11.2。 访

    2024年02月15日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包