Docker容器中使用Nvidia GPU报错 docker: Error response from daemon: could not select device driver “” with capabilities: [[gpu]].
问题出现
我们知道,想要在 docker19 及之后的版本中使用 nvidia gpu 已经不需要单独安装 nvidia-docker 了,这已经被集成到了 docker 中。
相必大家也知道,要使用宿主机的 GPU,需要在 docker run
的时候添加 --gpus [xxx]
参数。但是,在我们刚刚安装好 docker 并构建好镜像之后,直接这样运行是有问题的,即:
docker run -it --gpus all image_name:tag_name
会出现如题报错:
docker: Error response from daemon: could not select device driver “” with capabilities: [[gpu]].
解决方案
实际上,我们在通过 --gpus
参数来使用宿主机的 GPU 时,需要先安装一个英伟达的容器运行时。
另外需要注意的是,这个东西是不能直接 apt install,会报找不到该软件,需要先添加英伟达的 apt 软件源。具体操作步骤如下:
1 添加源
将下面的脚本放到任意位置,
# nvidia-container-runtime-script.sh
sudo curl -s -L https://nvidia.github.io/nvidia-container-runtime/gpgkey | \
sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
sudo curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.list | \
sudo tee /etc/apt/sources.list.d/nvidia-container-runtime.list
sudo apt-get update
并执行:
sudo sh nvidia-container-runtime-script.sh
会得到类似如下输出:
OK
deb https://nvidia.github.io/libnvidia-container/ubuntu18.04/$(ARCH) /
deb https://nvidia.github.io/nvidia-container-runtime/ubuntu18.04/$(ARCH) /
Hit:1 http://archive.canonical.com/ubuntu bionic InRelease
Get:2 https://nvidia.github.io/libnvidia-container/ubuntu18.04/amd64 InRelease [1139 B]
Get:3 https://nvidia.github.io/nvidia-container-runtime/ubuntu18.04/amd64 InRelease [1136 B]
Hit:4 http://security.ubuntu.com/ubuntu bionic-security InRelease
Get:5 https://nvidia.github.io/libnvidia-container/ubuntu18.04/amd64 Packages [4076 B]
Get:6 https://nvidia.github.io/nvidia-container-runtime/ubuntu18.04/amd64 Packages [3084 B]
Hit:7 http://us-east4-c.gce.clouds.archive.ubuntu.com/ubuntu bionic InRelease
Hit:8 http://us-east4-c.gce.clouds.archive.ubuntu.com/ubuntu bionic-updates InRelease
Hit:9 http://us-east4-c.gce.clouds.archive.ubuntu.com/ubuntu bionic-backports InRelease
Fetched 9435 B in 1s (17.8 kB/s)
Reading package lists... Done
2 安装
经过第一步之后,英伟达的软件源就已经添加好了,接下来直接 apt 安装就行了:
sudo apt-get install nvidia-container-runtime
安装完成后验证一下,输入:
which nvidia-container-runtime
应当得到输出:
/usr/bin/nvidia-container-runtime
这就表明该软件已经正常安装好了。
3 运行容器
安装好之后,就可以运行我们带 GPU 的容器了:
docker run -it --gpus all image_name:tag_name
此时不会报错,正常进入容器。
4 选定GPU编号
如果需要指定某个 GPU 编号,规范还是很严格的,笔者亲测下面这种格式是可以的:
docker run -it --gpus '"device=0,2"' --shm-size 32g image_name:tag_name
Ref:文章来源:https://www.toymoban.com/news/detail-491582.html
https://blog.csdn.net/BigData_Mining/article/details/104991349文章来源地址https://www.toymoban.com/news/detail-491582.html
到了这里,关于docker gpu报错Error response from daemon: could not select device driver ““ with capabilities: [[gpu]]的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!