Ubuntu NVIDIA-Docker安装

这篇具有很好参考价值的文章主要介绍了Ubuntu NVIDIA-Docker安装。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

系统环境:
系统:linux
版本:ubuntu20.04

Docker简介

Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux或Windows操作系统的机器上,也可以实现虚拟化。NVIDIA 改进了原始的Docker,便于容器使用NVIDIA GPU。由于仿真环境的配置需要安装很多库,对于新手不太友好,因此我们提供了Docker镜像,便于开发者使用。尽管Docker理论上适配多种操作系统,但由于后续算法开发仍建议在本地进行,因此操作系统仍需使用Ubuntu。

NVIDIA驱动安装

nvidia-docker需要宿主机已经安装nvidia驱动,为了与镜像的驱动版本保持一致,开发者需要安装470版本,以下安装方式的前提是之前没有安装或是通过apt安装的nvidia驱动。如果之前是其他方法安装的驱动,要根据具体情况更改驱动版本。

安装 nvidia-driver-470 指令

sudo apt install nvidia-driver-470

查看GPU型号
Ubuntu NVIDIA-Docker安装

jk-jone@JKKC:~$ lspci | grep -i nvidia
01:00.0 3D controller: NVIDIA Corporation Device 1f9c (rev a1)

查看当前NVIDIA驱动版本

sudo dpkg --list | grep nvidia-*
或者
cat /proc/driver/nvidia/version

Ubuntu NVIDIA-Docker安装

jk-jone@JKKC:~$ sudo dpkg --list | grep nvidia-*
jk-jone@JKKC:~$

Ubuntu NVIDIA-Docker安装

jk-jone@JKKC:~$ cat /proc/driver/nvidia/version
cat: /proc/driver/nvidia/version: 没有那个文件或目录

像这样则表示没有安装NVIDIA驱动

sudo apt install nvidia-driver-470

用这个装就行了

安装过程会有进度条

看到这个表示安装成功
Ubuntu NVIDIA-Docker安装

NVIDIA-Docker安装

之后安装nvidia-docker

curl https://get.docker.com | sh   && sudo systemctl --now enable docker

Ubuntu NVIDIA-Docker安装

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
      && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
            sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
            sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

Ubuntu NVIDIA-Docker安装

sudo apt-get update
sudo apt-get install -y nvidia-docker2
sudo systemctl restart docker

通过运行如下命令测试Docker使用安装成功

sudo docker run --rm --gpus all nvidia/cuda:11.0.3-base-ubuntu20.04 nvidia-smi

Ubuntu NVIDIA-Docker安装

docker: Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as ‘legacy’
nvidia-container-cli: initialization error: nvml error: driver not loaded: unknown.

出现了这个问题

翻了很多帖子,最后在github上 NVIDIA/nvidia-docker/issues/1648 找到答案。

是gpu的持久模式(nvidia-persistenced daemon)并未开启。

nvidia-smi

查询显卡资源的时候
报错
Ubuntu NVIDIA-Docker安装

jk-jone@JKKC:~$ nvidia-smi -a
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

可能是内核版本更新的问题,导致新版本内核和原来显卡驱动不匹配

查看已安装内核
Ubuntu NVIDIA-Docker安装

jk-jone@JKKC:~$ dpkg --get-selections |grep linux-image
linux-image-5.14.0-1051-oem deinstall
linux-image-5.14.0-1054-oem deinstall
linux-image-5.14.0-1058-oem install
linux-image-5.14.0-1059-oem install
linux-image-oem-20.04 install

查看正在使用的内核

uname -a

Ubuntu NVIDIA-Docker安装

jk-jone@JKKC:~$ uname -a
Linux JKKC 5.14.0-1059-oem #67-Ubuntu SMP Mon Mar 13 14:22:10 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux

显示为 5.14.0-1059

不知道安装nvidia驱动时的内核版本

不知道是不是不匹配造成的

只需执行两条命令就好

sudo apt-get install dkms

查看驱动版本

ls /usr/src | grep nvidia

Ubuntu NVIDIA-Docker安装

jk-jone@JKKC:~$ ls /usr/src | grep nvidia
nvidia-470.182.03

sudo dkms install -m nvidia -v 470.182.03470.182.03表示的是驱动版本号)

jk-jone@JKKC:~$ sudo dkms install -m nvidia -v 470.182.03
Module nvidia/470.182.03 already installed on kernel 5.14.0-1059-oem/x86_64
Ubuntu NVIDIA-Docker安装
所以不是内核不匹配造成的

重启下电脑试试
呵呵,画面出来了
Ubuntu NVIDIA-Docker安装

nvidia-smi -a

查询自己的 Persistence Mode 是否开启

Ubuntu NVIDIA-Docker安装
果然 Persistence Mode 为 Disabled

使用root权限执行如下命令:
nvidia-smi -pm ENABLED

再次用下面的命令,来查看Docker是否安装成功

sudo docker run --rm --gpus all nvidia/cuda:11.0.3-base-ubuntu20.04 nvidia-smi
Wed Apr 12 02:47:12 2023       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.182.03   Driver Version: 470.182.03   CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   50C    P8    N/A /  N/A |      9MiB /  1878MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
+-----------------------------------------------------------------------------+

出现这个就成功了。文章来源地址https://www.toymoban.com/news/detail-421659.html

到了这里,关于Ubuntu NVIDIA-Docker安装的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ubuntu20.04如何安装nvidia-docker?

    导入 NVIDIA GPG 密钥 添加 NVIDIA Docker 存储库 安装 nvidia-container-toolkit 检查nvidia-docker是否安装成功 如果 nvidia-docker 安装成功,命令将启动一个包含 NVIDIA GPU 的容器并运行 nvidia-smi 命令,该命令可以显示有关 GPU 状态的信息。输出结果将显示 GPU 型号、显存大小、温度等信息。 如

    2024年02月15日
    浏览(38)
  • ubuntu 20.04 docker及nvidia-docker2安装

            使用GPU经常会到要使用nivida-docker2的情况,网上吧老有些不负责人的给安装步骤造成误导,不能一次成功,现将自己一次成功的经验分享如下: 1、安装docker(command by command) # Add Docker\\\'s official GPG key: sudo apt-get update sudo apt-get install ca-certificates curl gnupg sudo install

    2024年01月18日
    浏览(29)
  • 深度学习docker环境配置之nvidia-docker安装使用

    –docker容器技术–。 简单理解 :Anaconda用于隔离不同的python环境;docker可以理解成在你的机器里面安装了一个独立的系统,因此它可以隔离不同的CUDA环境,还有着独立的文件系统,防止别人删掉你的实验和环境等。 镜像(images)的意思就是静态的镜像文件; 容器(containe

    2024年02月06日
    浏览(34)
  • Ubuntu 22.04 LTS 安装nvidia-docker NVIDIA Container Toolkit

    docker info 配置apt源 安装nvidia-container-toolkit 安装日志 参考资料: Installation Guide — container-toolkit 1.13.5 documentation

    2024年02月14日
    浏览(53)
  • 在 OpenEuler 系统上安装 Docker 和 Nvidia-Docker

    ip设置 关闭selinux 1、查看 selinux 状态,SELinux=enabled 即开启 2、关闭selinux,SELINUX=disabled 即关闭 3.重启服务器 显卡检查 查询结果如下: 可以查询到显卡的型号,需要注意以下参数: (rev a1) 表示显卡已启用 (rev ff) 表示显卡未启用,需要根据服务器型号通过BIOS开启 检查驱动是否

    2024年02月04日
    浏览(29)
  • 深度linux社区版 20.8 安装 nvidia-docker,启动Stable Diffusion WebUI docker 容器

    以下为失败的记录,成功方法直接跳到末尾。  说明: 深度apt 源中无法直接安装nvidia-docker  github地址: GitHub - NVIDIA/nvidia-docker: Build and run Docker containers leveraging NVIDIA GPUs 下载最新release https://github.com/NVIDIA/nvidia-docker/archive/refs/tags/v2.13.0.tar.gz 使用国内源 新建文件:ubuntu20.04

    2024年02月16日
    浏览(31)
  • nvidia-docker安装教程

    Nvidia-Docker安装需要安装两个部分, Docker-CE 和 NVIDIA Container Toolkit 。 1. 安装Dokcer-CE Docker-CE on Ubuntu can be setup using Docker’s official convenience script: 官方的快速安装脚本,具体安装的版本应该是最新版,如果用此脚本安装Docker,以后还可以使用此脚本更新: 注意 :如果你的机器已

    2024年02月16日
    浏览(39)
  • 安装nvidia-docker的步骤

    以下是安装nvidia-docker的步骤: 安装Docker CE 首先需要在节点上安装Docker CE。可以使用官方教程进行安装。 安装NVIDIA GPU驱动 在Kubernetes节点上安装NVIDIA GPU驱动,可以使用NVIDIA提供的官方安装脚本。 添加NVIDIA repository 添加NVIDIA repository,以便能够下载nvidia-docker的安装包。使用以

    2024年02月06日
    浏览(32)
  • docker和nvidia-docker的安装以及错误记录

    参考链接: nvidia-docker的安装 参考链接 E: Conflicting values set for option Signed-By regarding source https://nvidia.github.io/libnvidia-container/stable/ubuntu18.04/amd64/ /: /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg != E: The list of sources could not be read. 解决方法 会列出1个或者2个文件 然后进入/etc/apt/sour

    2024年02月11日
    浏览(29)
  • 『CV学习笔记』docker和nvidia-docker离线安装

    docker和nvidia-docker离线安装 这里是ubuntu操作系统, 如果是其他的操作系统,则需要安装对应的deb包

    2024年02月13日
    浏览(24)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包