在 OpenEuler 系统上安装 Docker 和 Nvidia-Docker

这篇具有很好参考价值的文章主要介绍了在 OpenEuler 系统上安装 Docker 和 Nvidia-Docker。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

环境检查

ip设置

# 设置ip
nmcli con add type ethernet con-name net-static ifname eno1 ip4 192.168.200.10/24 gw4 192.168.200.1 
# 查看网卡状态
nmcli dev status
# 查看ip
ip addr
# 关闭网卡
nmcli device disconnect eno1
# 启动网卡
nmcli connection up id eno1

关闭selinux

1、查看 selinux 状态,SELinux=enabled 即开启

sestatus

2、关闭selinux,SELINUX=disabled 即关闭

sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config

3.重启服务器

reboot

显卡检查

# 查看显卡状态
lspci | grep -i nvidia
lspci | grep -i vga

查询结果如下:

可以查询到显卡的型号,需要注意以下参数:
(rev a1) 表示显卡已启用
(rev ff) 表示显卡未启用,需要根据服务器型号通过BIOS开启

nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

显卡驱动安装

检查驱动是否安装

# 执行,如果没有找到命令,则说明驱动没有安装,需要手动安装。
nvidia-smi

禁用nouveau系统自带驱动

注意: 安装驱动前,需要禁用nouveau系统自带驱动

1、查看系统自带的驱动,如果有结果,则说明存在nouveau,没有则直接跳过这一步。

lsmod | grep nouveau

2、禁用nouveau系统自带驱动

# 编辑如下文件:
vi /usr/lib/modprobe.d/dist-blacklist.conf

# 然后在最后添加如下内容:
blacklist nouveau
options nouveau modeset=0

3、重启服务器
重启后,确认成功禁用
nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

安装基础rpm依赖包

说明: 安装Nvidia驱动所需要的依赖包为:kernel-devel、gcc、dkms
注意: yum提供的kernel-devel的版本要和当前服务器内核版本一致,确保所需的依赖包版本一致
处理方法: 直接找下载操作系统对应版本的iso文件,设置本地yum源,通过本地yum源安装所需依赖包
本地yum源配置参考: https://docs.openeuler.org/zh/docs/22.03_LTS/docs/Administration/搭建repo服务器.html

1、查看kernel-devel版本

# 查看服务器内核版本
uname -r

# 查看yum环境中提供的kernel-devel包版本
yum list|grep kernel-devel

查询结果如下:nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

2、安装依赖包。

yum install gcc dkms gcc-c++

下载安装显卡驱动安装

1、查看显卡型号

lspci | grep -i vga

查询结果如下:

显卡型号为: NVIDIA GeForce RTX 3060 Ti

nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

2、下载显卡驱动

下载地址: https://www.nvidia.cn/geforce/drivers/

选择以下信息,下载最新版本的驱动
nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

我这里下载的是 “驱动程序版本: 525.1160 - 发行日期: 2023-5-9”
nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

3、安装显卡驱动

将驱动上传到服务器上,在驱动路径下执行命令

./NVIDIA-Linux-x86_64-525.116.04.run --kernel-source-path=/usr/src/kernels/5.10.0-60.18.0.50.oe2203.x86_64/ -no-x-check

在命令运行完成后执行 nvidia-smi 查看显卡状态
正常返回结果如下:
nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

docker 和 nvidia-docker 安装

安装docker

1、下载docker安装包

下载地址: https://download.docker.com/linux/static/stable/x86_64/

2、上传安装包到 /opt/software

通过文件传输工具,如:winscp、xftp

3、解压安装

tar -zxvf docker-20.10.9.tgz

4、复制二进制文件到/usr/bin目录下

cp /home/docker/* /usr/bin/

5、配置系统服务,创建docker.service文件

vi /usr/lib/systemd/system/docker.service
# 按 "i键" 进入编辑模式,单机部署或portainer管理端部署时写入以下内容
-----------------------------------------------------------------
[Unit]
Description=Docker Application Container Engine
Documentation=https://docs.docker.com
After=network-online.target firewalld.service
Wants=network-online.target
[Service]
Type=notify
EnvironmentFile=-/etc/default/docker
ExecStart=/usr/bin/dockerd
ExecReload=/bin/kill -s HUP
LimitNOFILE=infinity
LimitNPROC=infinity
TimeoutStartSec=0
Delegate=yes
KillMode=process
Restart=on-failure
StartLimitBurst=3
StartLimitInterval=60s
[Install]
WantedBy=multi-user.target
-----------------------------------------------------
# 退出,然后按一下esc键,然后直接输入:wq,意思就是写完以后保存。

6、(非必选,根据实际情况决定)
配置daemin.json文件,设置docker数据存储目录、限制容器日志大小,开启docker 2375端口、配置docker hub仓库地址

# 创建目录
mkdir /etc/docker

# 编辑 daemon.json 文件
vi /etc/docker/daemon.json
# 写入
{
"data-root": "/opt/docker",
"log-driver": "json-file",
"log-opts": {"max-size":"500m", "max-file":"4"},
"hosts": ["tcp://0.0.0.0:2375", "unix:///var/run/docker.sock"],
"default-ulimits": {"nofile": {"Name": "nofile","Hard": 64000,"Soft": 64000}},
"insecure-registries" : ["192.168.10.156"]
}

说明:
​data-root —设置docker数据默认存储路径
​log-driver —设置容器日志的格式为json
​log-opts —设置单个日志文件的大小为 500M,最多存储 4 个日志文件
​tcp://0.0.0.0:2375 —表示允许任何远程客户端通过 2375 端口连接 DockerDaemon
​unix:///var/run/docker.sock —表示本地客户端将通过这个来连接 Docker Daemon

insecure-registries —配置docker hub 仓库地址

default-ulimits -调整默认的ulimit 值

备注:
portainer 所在的主机不需要配置 hosts 这一行的内容,编辑配置文件时删除即可。
​在没有docker hub仓库地址的时候, insecure-registries 这一行的内容可以不配置,编辑配置文件时删除即可。

7、重启docker的守护线程

systemctl daemon-reload           #刷新系统服务配置文件
systemctl start docker.service    #启动docker
systemctl enable docker.service   #配置开机自启
systemctl status docker.service   #查看docker状态

8、执行docker version 查看是否安装成功

正常返回如下:
nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

安装nvidia-docker

1、下载nvidia-docker安装包

说明: 这里是通过rpm包的方式安装,需要下载以下rpm包

注意: 这里直接选择centos7即可,确保各个文件版本是对应的,且尽可能下载最新版本防止出现问题

下载地址: https://github.com/NVIDIA/libnvidia-container/tree/gh-pages/stable

需要下载的rpm包:
nvidia-container-runtime-3.9.0-1.noarch.rpm
nvidia-docker2-2.9.1-1.noarch.rpm
nvidia-container-toolkit-1.9.0-1.x86 64.rpm
stable centos7 x86 64 libnvidia-container1-1.9.0-1.x86 64.rpm
stable centos7 x86 64 libnvidia-container-tools-1.9.0-1.x86 64.rpm
stable centos7 x86 64 libnvidia-container-devel-1.9.0-1.x86 64.rpm

nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力

2、安装nvidia-docker

将下载完成的文件上传到服务器同一个文件夹内,运行以下命令安装(不同的Linux发行版用对应的安装指令安装)

rpm -Uvh *.rpm --nodeps --force

安装完成后需要重启docker服务

systemctl restart docker

3、测试,下载tritonserver镜像进行测试

根据实际情况,下载对应版本的tritonserver,离线服务器可以通过镜像导入导出的方式测试。

镜像源地址: https://catalog.ngc.nvidia.com/orgs/nvidia/containers/tritonserver/tags

# 拉取镜像
docker pull nvcr.io/nvidia/tritonserver:21.10-py3

# 运行容器
docker run -it --gpus all nvcr.io/nvidia/tritonserver:21.10-py3 /bin/bash

在容器里执行nvidia-smi 命令,成功则返回如下结果:
nvidia-docker,容器技术,Linux 系统,docker,linux,ai,gpu算力
到这里,docker和nvidia-docker已经安装完成,从程序里已经可以调用到物理显卡,接下来就进行AI服务安装。文章来源地址https://www.toymoban.com/news/detail-760138.html

到了这里,关于在 OpenEuler 系统上安装 Docker 和 Nvidia-Docker的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【HCIA-openEuler】实验手册—01【openEuler操作系统安装】

    ​ 主要介绍虚拟化环境安装及openEuler操作系统安装。 ​ 掌握实验环境的搭建 ​ 掌握openEuler操作系统的安装部署 表1-1 openEuler实验所需材料 材料及版本 下载地址 openEuler-20.03-LTS-everything-x86_64-dvd.iso https://mirrors.tuna.tsinghua.edu.cn/openeuler/openEuler-20.03-LTS/ISO/x86_64/openEuler-20.03-LTS-ev

    2024年03月12日
    浏览(46)
  • Centos、OpenEuler系统安装mysql

    要在CentOS上安装MySQL并设置开机自启和root密码,请按照以下步骤进行操作: 确保您的CentOS系统已连接到Internet,并且具有管理员权限(root或sudo访问权限)。 打开终端或SSH会话,使用以下命令安装MySQL: 安装完成后,使用以下命令启动MySQL服务: 确保MySQL服务在系统启动时自

    2024年02月10日
    浏览(30)
  • ubuntu安装docker及nvidia-container-toolkit(nvidia-docker和nvidia-docker2)

    旧版本的 Docker 称为 docker 或者 docker-engine,使用以下命令卸载旧版本: 为了确认所下载软件包的合法性,需要添加软件源的 GPG 密钥。 鉴于国内网络问题,强烈建议使用国内源,官方源请在注释中查看。 然后,我们需要向 sources.list 中添加 Docker 软件源: 以上命令会添加稳定

    2024年02月08日
    浏览(49)
  • 安装openeuler系统和ssh远程登录

    设置32G,动态空间申请,设置为单个文件 内存:推荐2GB 处理器:1颗、2核心 ==新CD/DVD:适应ISO映像文件,点击浏览按钮,选择之前下载好的openEuler-22.03-LTS-SP2-x86_64-dvd.iso镜像文件== 网络适配器:选择NAT模式 显示器:去掉\\\"加速3D图形“的对钩 最终: 选择关闭、完成 使用鼠标点

    2024年01月17日
    浏览(33)
  • VMware安装openEuler-20.03系统图文安装教程

    VMware安装openEuler-20.03系统图文安装教程 系统架构:x86_64 虚拟机软件:VMware16 pro 安装的操作系统:openEuler-20.03-LTS 2.1. 下载操作系统 [点击此处下载openEuler操作系统] 点击此处下载openEuler操作系统 如下图,请选择x86_64架构的ISO:openEuler-20.03-LTS-x86_64-dvd.iso 3.1 创建新的虚拟机 打开

    2023年04月08日
    浏览(45)
  • 【Ubuntu】为Docker安装NVIDIA运行时环境(NVIDIA Container Runtime for Docker)

    在Ubuntu系统上,为Docker安装NVIDIA运行时环境(NVIDIA Container Runtime for Docker)通常涉及以下步骤: 安装Docker (如果您还没有安装): 首先,确保您的系统已经安装了Docker。您可以使用以下命令进行安装: 添加NVIDIA容器运行时的存储库 : 执行以下命令以添加NVIDIA的Apt存储库:

    2024年01月24日
    浏览(43)
  • nvidia-docker安装教程

    Nvidia-Docker安装需要安装两个部分, Docker-CE 和 NVIDIA Container Toolkit 。 1. 安装Dokcer-CE Docker-CE on Ubuntu can be setup using Docker’s official convenience script: 官方的快速安装脚本,具体安装的版本应该是最新版,如果用此脚本安装Docker,以后还可以使用此脚本更新: 注意 :如果你的机器已

    2024年02月16日
    浏览(46)
  • openEuler 22.03 LTS-SP1体验安装docker、防火墙配置等

    openEuler默认采用firewall-cmd进行管理,iptables默认是禁用状态。

    2024年02月16日
    浏览(41)
  • 安装nvidia-docker的步骤

    以下是安装nvidia-docker的步骤: 安装Docker CE 首先需要在节点上安装Docker CE。可以使用官方教程进行安装。 安装NVIDIA GPU驱动 在Kubernetes节点上安装NVIDIA GPU驱动,可以使用NVIDIA提供的官方安装脚本。 添加NVIDIA repository 添加NVIDIA repository,以便能够下载nvidia-docker的安装包。使用以

    2024年02月06日
    浏览(39)
  • Ubuntu NVIDIA-Docker安装

    系统环境: 系统:linux 版本:ubuntu20.04 Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux或Windows操作系统的机器上,也可以实现虚拟化。NVIDIA 改进了原始的Docker,便于容器使用NVIDIA GPU。由于仿真

    2023年04月22日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包