安装依赖指南
标准的深度学习三件套包括pytorch, cuda, cudnn。根据经验,一般安装顺序如下:
- 为GPU安装驱动和cuda。到官网安装cuda toolkit
- 用conda安装cudatoolkit。用conda安装cuda
conda install cudatoolkit==11.7
,使用清华源(到官网确认安装了符合pytorch要求的cuda版本) - 用pip安装pytorch,使用清华源。
- 安装合适版本的cudnn。
如何安装cuda
到官网下载cuda安装包 https://blog.csdn.net/h3c4lenovo/article/details/119003405
安装方式有deb、在线deb和runfile可选,本人用在线deb安装。它会为你同时安装driver和toolkit。
安装后,运行nvidia-smi
和ls/usr/local
查看nvdiia cuda版本。
nvidia cuda 安装失败,报错"you are running x server … installation failed "
如果报错"you are running x server",说明有程序在使用显卡,要关闭lghtdm。
https://blog.csdn.net/lien0906/article/details/54312166
英文版。高赞回答
https://unix.stackexchange.com/questions/25668/how-to-close-x-server-to-avoid-errors-while-updating-nvidia-driver
sudo service lightdm stop
ubuntu driver/library version mismatch:重装驱动
驱动和library的版本不一致,需要检查版本,并卸载重装驱动!
如何查看驱动版本
https://xujinzh.github.io/2022/05/25/nvidia-driver-library-version-mismatch/
…系统运行中的 NVIDIA 驱动版本(查看方法:cat /proc/driver/nvidia/version)与安装的驱动版本(查看方法:sudo dpkg -l | grep nvidia)不一致
如何卸载驱动
https://itslinuxfoss.com/fix-failed-initialize-nvml-driver-library-version-mismatch-error/
sudo apt purge nvidia*
安装conda cudatoolkit
用conda安装即可:conda install cudatoolkit==11.7
,conda可以使用国内清华源。
如何下载pytorch gpu离线版本
参考博客 https://blog.csdn.net/qq_51206550/article/details/127835129
下载pytorch gpu版本太慢,到官方镜像 https://download.pytorch.org/whl/torch/,下载需要的GPU版本,比如torch-1.13.1+cu117-cp39-cp39-win_amd64.whl
,其中cu117代表cuda版本为11.7,cp37代表python版本为3.7。
https://blog.csdn.net/qq_41710226/article/details/125548986文章来源:https://www.toymoban.com/news/detail-429867.html
如何安装cudnn
在windows安装cudnn详见"2. Installing cuDNN on Windows"一章,简单讲就是下载cudnn的压缩包,放到某个路径,再将bin目录添加到path。文章来源地址https://www.toymoban.com/news/detail-429867.html
到了这里,关于深度学习三件套安装依赖指南(linux)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!