我用的操作系统为ubuntu20.04,其他系统应该类似,只是命令稍有不同。
安装AMD GPU驱动
AMD驱动下载地址:https://www.amd.com/en/support/kb/release-notes/rn-amdgpu-unified-linux-22-20
进去之后找到你想安装的版本,这里是闭源驱动。
下载好后运行sudo apt install amdgpu-install_5.4.50403-1_all.deb
这个名字根据自己下载的文件进行更改,直接Tab就行。
如果报依赖错误可以尝试sudo apt-get -f install命令来修复依赖错误。
之后更新依赖sudo apt update.
安装ROCM
安装ROCM,这里要--no-dkms不安装内核,看资料好像现在的ubuntu自己带内核,所以加上好像会有问题。有知道的可以评论区讨论。
sudo amdgpu-install --usecase=rocm,hip,mllib --no-dkms
到这里驱动和ROCM就安装完了。
安装Pytorch
可以在pytorch官网找到安装命令
https://pytorch.org/
例如我用pip安装
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2
测试安装
打开python3
import torch
torch.cuda.is_available()
如果返回True
恭喜你,安装成功。
安装完之后可能还需要进行一些操作。
#添加环境
sudo usermod -a -G video $LOGNAME
sudo usermod -a -G render $LOGNAME
#在文件执行
vim ~/.bashrc #添加下面
export HSA_OVERRIDE_GFX_VERSION=10.3.0 #我这里的显卡是amd的RX6700xt
export LD_LIBRARY_PATH=/opt/rocm/lib
source ~/.bashrc#通重新执行刚修改的初始化文件
# 如果运行import之后报错找不到这些文件,复制一下链接文件
cd $LD_LIBRARY_PATH
cp librocblas.so.0 librocblas.so
cp libMIOpen.so.1 libMIOpen.so
cp librocrand.so.1 librocrand.so
其它问题:
Process finished with exit code 139 (interrupted by signal 11: SIGSEGV)
我还遇到了这个报错,原因是我没有添加
export HSA_OVERRIDE_GFX_VERSION=10.3.0 #我这里的显卡是amd的RX6700xt
export LD_LIBRARY_PATH=/opt/rocm/lib
到对应的用户下,只加了root,所以只有root能用。
有热心网友指出:文章来源:https://www.toymoban.com/news/detail-597714.html
dkms可以安装。跟系统内核不冲突,只有在装多版本ROCm时不能装dkms。
export HSA_OVERRIDE_GFX_VERSION=10.3.0一般不用。我的同学时7900xtx被这个坑了一下,不用export就行。
也不用export LD_LIBRARY_PATH=/opt/rocm/lib ,hipconfig命令执行应该能获得准确的环境变量。rocmdev和mlsdk也可以安装一下。文章来源地址https://www.toymoban.com/news/detail-597714.html
到了这里,关于AMD GPU驱动,ROCM,Pytorch安装教程(A卡6700xt)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!