ubuntu搭建深度学习环境

这篇具有很好参考价值的文章主要介绍了ubuntu搭建深度学习环境。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

安装vscode

方法一:

依次输入如下命令

1.sudo add-apt-repository ppa:ubuntu-desktop/ubuntu-make 
2.sudo apt-get update 
3.sudo apt-get install ubuntu-make 
4.umake ide visual-studio-code

可以在应用找到vscode即为成功

安装git

1.sudo apt update
2.sudo apt install git

可以在git --version打印出版本即为成功

安装cuda

在这里找CUDA Toolkit Archive | NVIDIA Developer

(nvcc -V的话是查询系统安装的cuda版本,而nvidia-smi是查看GPU使用情况的(也可以用来检查驱动是否安装成功)。nvidia-smi之所以会出现cuda version,我印象里谷歌给的解释是,release这个显卡驱动时英伟达使用的cuda版本。只需要保证nvidia-smi显示的cuda version比nvcc -V显示的版本高就行)

1.wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
2.sudo sh cuda_11.3.0_465.19.01_linux.run

以下这样即为成功

===========
= Summary =
===========

Driver:   Not Selected
Toolkit:  Installed in /usr/local/cuda-10.2/
Samples:  Installed in /home/wohu/, but missing recommended libraries

Please make sure that
 -   PATH includes /usr/local/cuda-10.2/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-10.2/lib64, or, add /usr/local/cuda-10.2/lib64 to /etc/ld.so.conf and run ldconfig as root

To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.2/bin

Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-10.2/doc/pdf for detailed information on setting up CUDA.
***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 440.00 is required for CUDA 10.2 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
    sudo <CudaInstaller>.run --silent --driver

Logfile is /var/log/cuda-installer.log

多种方式验证cuda是否安装成功

ll /usr/local/

若看到 /usr/local/ 目录下已经有 cuda -> /usr/local/cuda-10.2// 软链接,则为成功

然后继续配置cuda环境变量

打开.bashrc并修改

sudo vi ~/.bashrc

进入文件后使用上下左右移动键将光标移动到最后一行,然后使用字母按键o插入一行

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}

继而接着再插入一行

export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

最后按下esc按键,然后输入:wq即可保存

然后还要使得配置的环境变量生效,所以继续输入

sudo source  ~/.bashrc

如果遇到source command not found情况,可以切换到root用户,使用sudo -s切换,然后执行source ~/.bashrc 即可成功

当一切搞定,就可以测试cuda,查看cuda版本使用nvcc -V

卸载cuda

在cuda10.2里对应torch1.7.0和torchvision0.8.1使用nvidia 3090不太行(原因:算力7.0的显卡可以在支持最高算力7.5的CUDA版本下运行,但是算力7.5的显卡不可以在支持最高算力7.0的CUDA版本下运行,同理算力8.x的显卡不可以在支持最高算力7.x的CUDA版本下运行),会报错,所以此时只能升级torch版本

这里感觉装了两个无用cuda版本有点难受,所以卸载他们

cd /usr/local/cuda-xx.x/bin/ 
sudo ./cuda-uninstaller

ubuntu搭建深度学习环境

当下载cuda提示连接超时时,建议直接重启电脑

胡乱卸载导致nvidia-smi找不到设备了,故重新安装nvidia驱动

首先安装驱动前一定要更新软件列表和安装必要软件、依赖(必须)

sudo apt-get update   #更新软件列表
 
sudo apt-get install g++
 
sudo apt-get install gcc
 
sudo apt-get install make

lspci | grep -i nvidia或者ubuntu-drivers devices 查看显卡型号,然后进入这个网站

https://www.nvidia.cn/Download/index.aspx?lang=cn

卸载原有驱动

sudo apt-get remove --purge nvidia*   # 或者nvidia-*

禁用nouveau(nouveau是通用的驱动程序)(必须)

sudo gedit /etc/modprobe.d/blacklist.conf 或者(blacklist-nouveau.conf)

在打开的blacklist.conf末尾添加如下,保存文本关闭

blacklist nouveau
 
options nouveau modeset=0

在终端输入如下更新,更新结束后重启电脑(必须)

sudo update-initramfs –u

重启后在终端输入如下,没有任何输出表示屏蔽成功

lsmod | grep nouveau

安装lightdm,lightdm是显示管理器,主要管理登录界面,ubuntu20.04、21.04、22.04需要自行安装,然后上下键选择lightdm即可

sudo apt-get install lightdm

为了安装新的Nvidia驱动程序,我们需要停止当前的显示服务器。最简单的方法是使用telinit命令更改为运行级别3。在终端输入以下linux命令后,显示服务器将停止。(必须)

sudo telinit 3

进入黑漆漆的文本界面tty(如果进不去,就按Ctrl + Alt + F1~F6中的一个 (分别对应进入tty1~tty6)),然后输入用户名和密码

在文本界面中,禁用X-window服务,在终端输入(必须)

(如果是默认的gdm3显示管理器,命令为sudo /etc/init.d/gdm3 stop)

sudo /etc/init.d/lightdm stop或者(sudo service lightdm stop)

cd命令进入到你存放驱动的目录,输入命令:

sudo chmod 777 NVIDIA-Linux-x86_64-430.26.run   #给你下载的驱动赋予可执行权限,才可以安装

sudo ./NVIDIA-Linux-x86_64-430.26.run (–no-opengl-files)   #安装

简洁版

sudo apt-get update   #更新软件列表
 
sudo apt-get install g++  #安装必要依赖
sudo apt-get install gcc
sudo apt-get install make
 
sudo apt-get remove --purge nvidia*  #卸载原有所有驱动(或者nviida-*)
 
sudo gedit /etc/modprobe.d/blacklist.conf   #禁用nouveau,末尾添加如下两行命令保存
blacklist nouveau   
options nouveau modeset=0
 
sudo update-initramfs –u   #更新
reboot   #重启电脑
lsmod | grep nouveau   #检查,输入之后无其他输出,成功,继续
 
sudo telinit 3  #进入文本界面
sudo service gdm3 stop   #停止显示服务
sudo chmod 777 NVIDIA-Linux-x86_64-430.26.run   #给你下载的驱动赋予可执行权限,才可以安装
sudo ./NVIDIA-Linux-x86_64-430.26.run    #安装
 
sudo  service  gdm3 start   #重启显示服务,完成

安装anconda

Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

在镜像源下载anconda3-5.2.0-linux-x86_64版本

然后在下载文件位置打开终端,运行(bash+文件名)

bash Anaconda3-2020.02-Linux-x86_64.sh

一直enter,然后两次都yes

最后conda -v查看conda版本即可

配置conda镜像源

首先看安装地址有没有.condarc文件,没有则运行

conda config --set show_channel_urls yes

然后,如果有可视化界面,直接使用text editor编辑负责这一段进.condarc文件即可

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/main
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/r
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.bfsu.edu.cn/anaconda/cloud
  msys2: https://mirrors.bfsu.edu.cn/anaconda/cloud
  bioconda: https://mirrors.bfsu.edu.cn/anaconda/cloud
  menpo: https://mirrors.bfsu.edu.cn/anaconda/cloud
  pytorch: https://mirrors.bfsu.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.bfsu.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.bfsu.edu.cn/anaconda/cloud

实战项目

接下来以实战项目为例:fairmot的复现

首先我们去找到项目的github

遇到的第一个问题:cuda是11.4,没有适配的torch,所以需要去安装其他版本cuda,这里准备降到10.2版本

多cuda版本使用

多版本cuda动态切换(举例):
1、更改环境变量,将cuda-10.1变为cuda-9.0
sudo gedit ~/.bashrc
注释掉原来的cuda10.1版本的环境变量,替换为cuda9.0的环境变量
export PATH="$PATH:/usr/local/cuda-9.0/bin"
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64/"
export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda-9.0/lib64"
2、删除之前的软连接,并生成新的软连接
sudo rm -rf /usr/local/cuda #删除之前创建的软链接
sudo ln -s /usr/local/cuda-9.0 /usr/local/cuda #创建新 cuda 的软链接

对应项目所需torch去下载

https://download.pytorch.org/whl/cu113/torch_stable.html

  • cu102:表示cuda版本为10.2,(可以直接更改这个跳转链接)
  • torch-1.7.1:表示torch版本为1.7.1
  • cp38:表示适用python版本为3.8
  • linux:表示适用于linux系统
  • x86_64:表示同时兼容32和64位系统

然后在文件位置命令行运行pip install +文件名 -i https://mirrors.bfsu.edu.cn/pypi/web/simple文章来源地址https://www.toymoban.com/news/detail-412500.html

到了这里,关于ubuntu搭建深度学习环境的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【深度学习1】ubuntu22.04从零开始搭建深度学习环境

    具体安装步骤可以参考:win11+ubuntu22.04双系统安装(简洁版) 安装之前进入主板BIOS,关闭安全启动!!! 更新软件列表 安装必要的依赖 根据显卡型号下载对应的驱动,官方驱动下载链接:GeForce® 驱动程序 卸载原有驱动(若有) 禁用nouveau驱动,在 /etc/modprobe.d/blacklist.conf

    2024年02月05日
    浏览(98)
  • ubuntu20.04一键安装VScode搭建ROS编程环境

    VSCode 全称 Visual Studio Code,是微软出的一款轻量级代码编辑器,免费、开源而且功能强大。它支持几乎所有主流的程序语言的语法高亮、智能代码补全、自定义热键、括号匹配、代码片段、代码对比 Diff、GIT 等特性,支持插件扩展,并针对网页开发和云端应用开发做了优化。

    2023年04月24日
    浏览(50)
  • 深度学习-环境搭建(安装Pytorch)

    入门深度学习过程中,我决定在笔记本上搭建深度学习环境。我笔记本的显卡是NVIDIA 1050Ti,似乎足以支撑。由于我之前已经安装过Anaconda,所以是要在Anaconda上安装GPU版本的pytorch 略。 大多数人更推荐安装的是Miniconda,特别适合新手,能够节省空间和时间。 右键打开NVIDIA控制

    2023年04月26日
    浏览(59)
  • Anaconda安装教程以及深度学习环境搭建

    目录 前言 下载Anaconda 虚拟环境的搭建 在pycharm中配置现有的conda环境 CUDA简介 下载安装pytorch包 最近换新笔记本了,要重新安装软件,以前本来是想要写这个教程的,但当时由于截图不全还要懒得再下载重装,就放弃了,到后面又搁置了,而现在还要重新配置环境,所幸我有

    2024年02月11日
    浏览(58)
  • ubuntu 20.04 4090 显卡驱动安装 深度学习环境配置

    准备工作: 换源 安装输入法:重启的步骤先不管(自选) sudo apt update sudo apt upgrade 禁用nouveau驱动(这个驱动是ubuntu开源小组逆向破解NVIDIA的开源驱动,与英伟达的原有驱动不兼容)执行完第2.3步,先不重启。 打开 软件和更新 , 选择 附加驱动,安装推荐驱动(第一个),点

    2024年02月16日
    浏览(54)
  • 深度学习环境搭建-Nvidia驱动与Cuda安装

    说实话,笔者毕业后已经从业多年了,但是仍然有很多开发环境配置的问题让人懵圈,好在笔者一直有写笔记的习惯,之前一直是记录在私人云,如今整理出来分享给各位,并且除了说明步骤,还会尽可能解释这么做的原因,方便读者厘清逻辑。 注意:本文针对linux系统 本文

    2024年02月10日
    浏览(72)
  • 新的Ubuntu服务器上如何安装深度学习环境的docker

    背景: 硬件:联想的双3090显卡 总共 48GB显存 4TB 刀片式服务器。 软件:只安装了nvidia的驱动,能用nvidia-smi查看显卡信息,但是 nvcc -V看不到东西。 镜像包是 nvidia_cu11_tf15.tar,里面包含 公司nvidia驱动和环境里的TensorFlow,torch 是不一样的。一开始担心 是不是 要 降级 Ubuntu下的

    2024年02月10日
    浏览(60)
  • 安装anaconda3,并搭建一个python3.10开发环境【AI深度学习环境搭建】

    安装anaconda3,并搭建一个python3.10开发环境 1.打开conda官方下载地址 https://repo.anaconda.com/archive/,找到Anaconda3-2023.03-1-Windows-x86_64.exe 下载按默认方式安装到你目标盘。 2.打开安装好的Anaconda Powershell Prompt 执行 conda env list   查看本地的conda环境 (base) PS C:UsersAdministrator  conda env

    2024年02月08日
    浏览(56)
  • Ubuntu安装深度学习环境相关(yolov8-python部署)

    本文将从如下几个方面总结相关的工作过程: 1.Ubuntu系统安装(联想小新pro16) 2.显卡驱动安装 3.测试深度学习模型 之前在台式机上安装过Ubuntu,以为再在笔记本上安装会是小菜一碟,但没想还是废了一些功夫。 安装所需要的步骤: 1.电脑分盘:Windows下右键开始,选择磁盘管理

    2024年02月03日
    浏览(43)
  • Pytorch深度强化学习:Gym安装与环境搭建教程(附基本指令表)

    本专栏重点介绍强化学习技术的数学原理,并且 采用Pytorch框架对常见的强化学习算法、案例进行实现 ,帮助读者理解并快速上手开发。同时,辅以各种机器学习、数据处理技术,扩充人工智能的底层知识。 🚀详情:《Pytorch深度强化学习》 强化学习是在潜在的不确定复杂环

    2024年02月05日
    浏览(95)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包