ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】

这篇具有很好参考价值的文章主要介绍了ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、安装Nvidia Docker

二、安装显卡驱动

1、安装驱动

2、检查显卡驱动版本

3、查询驱动版本和显卡相关信息

三、Docker hub安装pytorch和对应版本cuda

1、在Docker hub中查询对应版本镜像

​编辑2、查询pytorch/pytorch的镜像

3、devel版本和runtime版本的区别

4、拉取对应版本镜像

5、查看拉取完成的镜像

6、生成容器

四、进入容器并查询相关信息

1、进入容器

2、打印环境变量

3、查询本地安装的软件和程序

4、显示NVIDIA CUDA 编译器(nvcc)的版本信息


前期因为要安装东西需要cuda10+的环境,查了部分资料发现对这方面的介绍不是很详细,所以结合前期整理的笔记,写一个比较详细的纯小白教程。

还要特别注意的是:此版本为Ubuntu20.04,默认的python版本为3.10。

一、安装Nvidia Docker

可以直接参考另一篇教程Ubuntu20.04 Nvidia Docker 安装-CSDN博客,写的很详细。

注意安装完毕后再进行下一步。

二、安装显卡驱动

1、安装驱动

sudo apt list nvidia-driver*

2、检查显卡驱动版本

lspci -k | grep -A 2 -i "VGA"

将输出当前主机的显卡驱动版本和驱动程序的详细版本。

3、查询驱动版本和显卡相关信息

nvidia-smi

ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】,linux系统,ubuntu系统,ubuntu,docker,linux

提示当前系统中的信息:

  1. 显卡信息:显示系统中安装的 NVIDIA 显卡的详细信息,包括显卡型号、设备ID、总线ID等。

  2. 驱动程序版本:显示当前系统中所使用的 NVIDIA 显卡驱动程序的版本号。

  3. GPU使用情况:显示每个显卡的使用情况,包括GPU利用率、显存使用情况、温度、风扇转速等。

  4. 进程信息:显示正在使用显卡资源的进程列表,包括进程ID、进程名称、GPU使用情况等。

  5. 其他相关信息:还会显示一些其他的诊断信息,如显卡电源状态、PCIe链接状态等。

三、Docker hub安装pytorch和对应版本cuda

显卡驱动安装成功后:

1、在Docker hub中查询对应版本镜像

2、查询pytorch/pytorch的镜像

选择需要的版本

ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】,linux系统,ubuntu系统,ubuntu,docker,linux

3、devel版本和runtime版本的区别

  1. Devel版本(pytorch:2.0.1-cuda11.7-cudnn8-devel):
    • Devel版本是用于开发和构建PyTorch的版本。
    • 它包含了用于编译和构建PyTorch库的开发工具和依赖项。
    • Devel版本通常用于构建自定义的PyTorch扩展、模型库或其他与PyTorch相关的软件。
    • 它包含了用于调试和开发的符号表和调试工具,可以帮助开发者进行错误排查和调试。
  2. Runtime版本(pytorch:2.0.1-cuda11.7-cudnn8-runtime):
    • Runtime版本是用于运行PyTorch应用程序的版本。
    • 它包含了PyTorch库和必要的运行时依赖项,但不包含开发工具和符号表。
    • Runtime版本通常用于在生产环境中部署和运行PyTorch应用程序。
    • 它不包含用于编译和构建自定义扩展或库的工具,因此不适用于开发新的PyTorch功能或调试代码。

总结:

Devel版本适用于开发者构建和扩展PyTorch,它包含了开发工具和依赖项,以及用于调试和错误排查的工具。Runtime版本适用于在生产环境中运行PyTorch应用程序,它只包含必要的运行时依赖项,不包含开发工具和符号表。【所以建议直接用devel版本的】

4、拉取对应版本镜像

我用的是pytorch:2.0.1-cuda11.7-cudnn8的devel版本,直接复制上述后面的命令行。

docker pull pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel

ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】,linux系统,ubuntu系统,ubuntu,docker,linux

输出表明你已成功下载了pytorch/pytorch镜像的特定版本2.0.1-cuda11.7-cudnn8-devel到本地。可以使用该镜像来创建和运行基于PyTorch的容器。

  • Pulling from pytorch/pytorch:表示正在从pytorch/pytorch镜像仓库中拉取镜像。
  • Pull complete:表示已成功下载一个镜像层。
  • Digest:表示镜像的摘要,用于唯一标识镜像的内容。
  • Status: Downloaded newer image for pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel:表示已成功下载标签为2.0.1-cuda11.7-cudnn8-develpytorch/pytorch镜像。

5、查看拉取完成的镜像

docker images

ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】,linux系统,ubuntu系统,ubuntu,docker,linux

6、生成容器

nvidia-docker run --gpus all -itd --name=alpa_test pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel

ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】,linux系统,ubuntu系统,ubuntu,docker,linux

其中是命名叫alpa_test,可以使用容器ID或容器名称直接进入容器。

截止到这一步就可以直接使用带有cuda+pytorch的容器了。

四、进入容器并查询相关信息

1、进入容器

docker exec -it alpa_test bash

2、打印环境变量

echo $LD_LIBRARY_PATH

3、查询本地安装的软件和程序

ls /usr/local/

ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】,linux系统,ubuntu系统,ubuntu,docker,linux

4、显示NVIDIA CUDA 编译器(nvcc)的版本信息

nvcc -V

ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】,linux系统,ubuntu系统,ubuntu,docker,linux文章来源地址https://www.toymoban.com/news/detail-775079.html

到了这里,关于ubuntu系统(6):Nvidia Docker配置cuda+pytorch【纯小白版】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • (纯小白向)Windows配置GPU深度学习环境:Cuda+Anaconda+pytorch+Vscode

    目录 一、Cuda和Cudnn下载安装 1.1 确定自己的电脑显卡驱动支持的Cuda版本 1.2 Cuda下载与安装 1.3 Cudnn下载与安装 二、Anaconda下载安装 2.1 下载 2.2 安装 2.3 手动配置环境变量 2.4 测试是否安装成功 三、Pytorch下载安装 3.1 创建conda虚拟环境 3.2 Pytorch下载 四、Vscode下载与环境配置 4.1

    2024年02月05日
    浏览(75)
  • Ubuntu 20.04 LTS 系统下 安装Nvidia 显卡驱动、CUDA、cuDNN, 并可进行CUDA版本切换

    因为做深度学习的研究项目,为全新机器在Ubuntu 20.04 LTS 系统下 安装Nvidia 显卡驱动、Cuda、Cudnn。并进行CUDA版本切换 成功安装完成了,写个记录。 步骤一: 安装更新软件列表和依赖项 在安装Nvidia显卡驱动之前,需要更新软件列表和必要的依赖项。 步骤二: 查看GPU型号,并

    2024年02月13日
    浏览(69)
  • Ubuntu18.04配置ZED_SDK 4.0, 安装Nvidia显卡驱动、cuda12.1

    首先卸载nvidia相关的、卸载cuda sudo apt-get purge nvidia* sudo apt-get autoremove sudo apt-get remove --auto remove nvidia-cuda-toolkit sudo apt-get purge nvidia-cuda-toolkit 官方卸载cuda的方法: 检查cuda还在不在: locate libcudart9.1 在软件更新中心里,手动安装显卡驱动。 ubuntu桌面-左下角九宫格-software upda

    2024年02月14日
    浏览(55)
  • 基于Docker的深度学习环境NVIDIA和CUDA部署以及WSL和linux镜像问题

    docker的介绍网上有很多,对于深度学习的认来讲,docker的好处就是直接把环境分享给他人,他人不需要再配置环境了。 比如我有一个目标检测的项目,我想分享给朋友,那么他首先需要在自己的电脑上配置好显卡驱动、CUDA、CuDNN,在拿到我的项目后,还需要安装各种依赖库,

    2024年02月05日
    浏览(43)
  • 实验笔记之——Ubuntu20.04配置nvidia以及cuda并测试3DGS与SIBR_viewers

    之前博文测试3DGS的时候一直用服务器进行开发,没有用过笔记本,本博文记录下用笔记本ubuntu20.04配置过程~ 学习笔记之——3D Gaussian Splatting源码解读_3dgs运行代码-CSDN博客 文章浏览阅读3.2k次,点赞34次,收藏62次。高斯模型的初始化,初始化过程中加载或定义了各种相关的

    2024年04月15日
    浏览(43)
  • Ubuntu 20.04 RTX 4090显卡 深度学习环境配置(Nvidia显卡驱动、CUDA11.6.0、cuDNN8.5)

    参考文献:从零到一保姆级Ubuntu深度学习服务器环境配置教程 看文献中“ 三、 NVIDIA驱动安装 ” 安装NVIDIA驱动,这也是安装CUDA10.0及其对应版本的CuDNN和tensorflow的重要步骤。 1.1.1 英伟达中国驱动官网 进入英伟达中国驱动官网 1.1.2 输入显卡型号查询 1.1.3 查看搜索结果 1.2.1 方

    2024年02月04日
    浏览(112)
  • 【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch)

    【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch) 📆 安装时间 2023.11.08-2023.11.10 Windows 和 Ubuntu 双系统的安装和卸载 B站教程 【本文基本上跟这个详细教程一致,优先推荐看这个!】ubuntu20.04 下深度学习环境配置 史上最详细教程 【精

    2024年02月04日
    浏览(65)
  • NVIDIA、CUDA、CUDNN、PyTorch安装吐血整理!!!

    判断你当前电脑的显卡是NVIDIA(N卡)还是AMD(A卡),Pytorch需要基于NVIDIA的显卡(N卡)上运行,A卡就不行了。 1.判断电脑应该装什么版本的CUDA。 方式一:NVIDIA 控制面板中查看 方式二:CMD查看 CMD中输入: 查看到本机可装CUDA版本12.0,版本向下兼容,意思就是 CUDA 12.0及以下

    2023年04月18日
    浏览(74)
  • ubuntu18.04复现yolo v8环境配置之CUDA与pytorch版本问题以及多CUDA版本安装及切换

    最近在复现yolo v8的程序,特记录一下过程 环境:ubuntu18.04+ros melodic 小知识:GPU并行计算能力高于CPU—B站UP主说的 Ubuntu可以安装多个版本的CUDA。如果某个程序的Pyorch需要不同版本的CUDA,不必删除之前的CUDA,可以实现多版本的CUDA切换 一、查看当前PyTorch使用的CUDA版本: 注意

    2024年02月11日
    浏览(52)
  • ubuntu下docker配置:python,cuda

    参考链接:https://zhuanlan.zhihu.com/p/407534754 python官网链接 https://www.python.org/downloads/source/ 选择需要的python版本下载。 操作命令如下: tar命令:通俗讲,这个命令是用来压缩/解压缩的。后面跟着的’-zxvf’是参数。\\\'z’表示用gzip处理文件,是默认的,可以省略;‘x’是从压缩包

    2024年02月09日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包