华为昇腾服务器 ubuntu20.04 Atlas中心推理卡 23.0.RC3 NPU驱动和固件安装指南 02(Atlas 300V pro)(Ascend 310P)(cann)安装流程记录

这篇具有很好参考价值的文章主要介绍了华为昇腾服务器 ubuntu20.04 Atlas中心推理卡 23.0.RC3 NPU驱动和固件安装指南 02(Atlas 300V pro)(Ascend 310P)(cann)安装流程记录。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

参考文章:Atlas 中心推理卡 23.0.RC3 NPU驱动和固件安装指南 02

参考文章:https://www.hiascend.com/document/detail/zh/quick-installation/23.0.RC3/quickinstg/800_3000/quickinstg_800_3000_0013.html

版本配套表

首先看版本配套表,比如我们推理卡是Atlas 300V pro,要看系统是不是支持Atlas 300V pro?找到合适版本的系统(内核版本也要匹配)

可以看到表中没有Atlas 300V pro,但实际上,我们通过联系技术人员,发现ubuntu20.04 5.4.0-100-generic内核是支持安装的,这点需要测试,或者跟华为技术人员确认。

(我们花费大量时间在安装ubuntu20.04系统上,在遇到内核版本不匹配时,尝试安装其他适合的内核版本,但发现切换内核版本后,网卡直接不显示了,网络无法正常工作;后来我们尝试直接安装指定内核版本的系统镜像,但由于连了外网,导致安装时自动升级了内核;后来我们断网安装,安装后连接外网之前禁用系统升级功能,问题这才得以解决)

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

用户必读

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维
升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

基础信息

服务器配置信息

我们是 Atlas 300V pro 视频解析卡

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

注意事项

不能混用安装方法

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维
https://support.huawei.com/enterprise/zh/doc/EDOC1100332527/289e2d2d

安装场景说明

我们的场景是在物理机安装驱动固件,然后拉取官方镜像进行开发推理。

物理机安装

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

实际操作

安装流程

https://support.huawei.com/enterprise/zh/doc/EDOC1100332527/c6904c01

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

我们每次都是重装操作系统后安装,应该是按照驱动-->固件的顺序安装。

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

确认操作系统

https://support.huawei.com/enterprise/zh/doc/EDOC1100332527?section=j005

uname -m && cat /etc/*release

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

root@ky:/home/HwHiAiUser# uname -m && cat /etc/*release
aarch64
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=20.04
DISTRIB_CODENAME=focal
DISTRIB_DESCRIPTION="Ubuntu 20.04.4 LTS"
NAME="Ubuntu"
VERSION="20.04.4 LTS (Focal Fossa)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 20.04.4 LTS"
VERSION_ID="20.04"
HOME_URL="https://www.ubuntu.com/"
SUPPORT_URL="https://help.ubuntu.com/"
BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
VERSION_CODENAME=focal
UBUNTU_CODENAME=focal
root@ky:/home/HwHiAiUser#

操作系统内核版本:

我们是用那个 ubuntu-20.04.4-live-server-arm64.iso 镜像默认断网安装的系统,内核版本5.4.0-100-generic(需要禁用系统升级,会升级内核版本的)。

获取软件包和配套表

https://support.huawei.com/enterprise/zh/doc/EDOC1100332527?section=j006

  • 获取设备的NPU卡芯片型号
    https://support.huawei.com/enterprise/zh/doc/EDOC1100332527?section=j006

    lspci -n -D | grep d500
    

    升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维
    可查询到设备信息,表明NPU卡的芯片型号为Ascend 310P

  • 软件包获取
    我这边因为权限问题下载有点困难,不过貌似运维技术帮我们下好了
    升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

创建运行用户

https://support.huawei.com/enterprise/zh/doc/EDOC1100332527?section=j007

root用户下运行:

groupadd HwHiAiUser
useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

确认安装

确认是先安装驱动,还是先安装固件

https://support.huawei.com/enterprise/zh/doc/EDOC1100332527?section=j008

安装驱动
确认安装方式

https://support.huawei.com/enterprise/zh/doc/EDOC1100332527/51429589

基本

有三种安装方式:

  • 二进制文件直接安装
  • 源码编译安装
  • 重构驱动包安装

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

因为我们已经安装了符合内核版本的操作系统,所以直接用run包(二进制文件直接安装)方式安装即可。

我们应该走的这条路线:

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

系统兼容性要求

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

环境检查
  • 操作系统内核版本

    uname -r
    

    升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

    root@ky:/home/HwHiAiUser# uname -r
    5.4.0-100-generic
    root@ky:/home/HwHiAiUser#
    
    
  • 系统是否安装过软件包

    lsmod | grep drv_pcie_host
    

    无内容表示未安装过软件包。可以直接安装软件包

  • 检测卡是否正常在位

    lspci | grep d500
    

    升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

  • 驱动安装过程中所需的Linux工具(略)

  • 相关配置文件
    升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

三种方式选1,我们选择第一种以二进制文件安装(.run包安装)
安装相关基础依赖

参考文章:https://www.hiascend.com/document/detail/zh/quick-installation/23.0.RC3/quickinstg/800_3000/quickinstg_800_3000_0013.html

参考文章:https://support.huawei.com/enterprise/zh/doc/EDOC1100332527/2645a51f

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

apt update

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

apt-get install -y gcc g++ make cmake zlib1g zlib1g-dev openssl libsqlite3-dev libssl-dev libffi-dev unzip pciutils net-tools libblas-dev gfortran libblas3 libopenblas-dev
安装驱动
./Ascend-hdk-310p-npu-driver_23.0.rc3_linux-aarch64.run --full
安装固件
./Ascend-hdk-310p-npu-firmware_7.0.0.5.242.run --full
安装cann相关

参考文章:https://www.hiascend.com/document/detail/zh/quick-installation/23.0.RC3/quickinstg/800_3000/quickinstg_800_3000_0013.html

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

我这里只写根据我们系统版本执行的步骤。

安装python相关

请参考这里:https://www.hiascend.com/document/detail/zh/quick-installation/23.0.RC3/quickinstg/800_3000/quickinstg_800_3000_0013.html

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

  • 安装python3-pip

    apt install python3-pip
    
  • 配置pip源(华为源)
    升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

    参考文章:https://www.hiascend.com/document/detail/zh/quick-installation/23.0.RC3/quickinstg/800_3000/quickinstg_800_3000_0049.html

    root用户下:

    mkdir ~/.pip
    cd ~/.pip
    vi pip.conf
    

    将以下内容添加到pip.conf中:

    [global]
    #以华为源为例,请根据实际情况进行替换。
    index-url = https://mirrors.huaweicloud.com/repository/pypi/simple
    trusted-host = mirrors.huaweicloud.com
    timeout = 120
    

    升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

  • 安装python库

    pip3 install attrs cython numpy decorator sympy cffi pyyaml pathlib2 psutil protobuf s                                                                                       cipy requests absl-py
    
安装cann

/home/HwHiAiUser目录下:

./Ascend-cann-toolkit_7.0.0.alpha002_linux-aarch64.run --install
修改~/.bashrc

安装好cann会提示:

Please make sure that the environment variables have been configured.
-  To take effect for all users, you can add "source /usr/local/Ascend/ascend-toolkit/set_env.sh" to /etc/profil                                                                                       e.
-  To take effect for current user, you can exec command below: source /usr/local/Ascend/ascend-toolkit/set_env.                                                                                       sh or add "source /usr/local/Ascend/ascend-toolkit/set_env.sh" to ~/.bashrc.

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

root用户下:

vi ~/.bashrc

在最后添加:

source /usr/local/Ascend/ascend-toolkit/set_env.sh

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

检查cann是否安装成功
npm-smi info

能够打印下面信息就表示没问题:

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维

重启系统后再重复上一步,没问题即可
reboot

切换到root执行,返回信息正常即可:

npm-smi info

不知道为何,在普通用户下执行上面命令是失败的:

升腾服务器使用教程,运维,linux,深度学习 deep_learning,华为,服务器,运维


至此,驱动、固件、cann安装成功文章来源地址https://www.toymoban.com/news/detail-790289.html

到了这里,关于华为昇腾服务器 ubuntu20.04 Atlas中心推理卡 23.0.RC3 NPU驱动和固件安装指南 02(Atlas 300V pro)(Ascend 310P)(cann)安装流程记录的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 将本地Django项目部署到服务器上(Ubuntu20.04)

    最近因为项目的需求开始正在搭建一个个人网站。在本地完成了项目后端的内容后需要部署到服务器上以供用户访问。因为后端使用的是Django框架,就在网上找了很多有关将Django项目部署到网站上的教程。由于本人在网络这块属于小白,原理了解甚少,在一边参照各种教程一

    2024年02月03日
    浏览(52)
  • 【服务器管理】Ubuntu20.04安装包管理工具module配置并且使用

    module 是一个专门管理环境变量的工具,全称是module environment,一般应用于软件或运行库等设备有多个版本,且需要分别配置这些环境变量。其官网为: https://modules.readthedocs.io/en/latest/index.html 通常,对于多版本的软件包,我们可以通过修改 ~/.bashrc 文件,通过修改 PATH 、 LD_LI

    2024年02月09日
    浏览(51)
  • Ubuntu 更换IP (服务器)以Ubuntu-live-server20.04为例

    1.切换root登录(默认登录root) 2.输入下面代码,摁Tab键,系统会自动识别并且查找哪一个网卡或者网口的配置文件 多半是(00或者01) 注意:Linux操作系统下 注意空格 3.看到配置文件之后,摁  i  进入编辑模式 ens33:代表网卡名称                                       

    2024年01月22日
    浏览(58)
  • Ubuntu20.04服务器使用教程(安装教程、常用命令、故障排查)持续更新中.....

    制作U盘启动盘,并安装系统 在MSDN i tell you下载Ubuntu20.04 Desktop 版本,并使用Rufus制作UEFI启动盘,参考UEFI安装Ubuntu 使用GPT+UEFI模式安装,记得更改主板选项Legacy to EFI support 为 enable 安装NVIDIA显卡驱动 先参考Ubuntu20.04下深度学习环境配置,配置apt-get换国内阿里源 参考Ubuntu18-22

    2024年02月04日
    浏览(58)
  • Ubuntu20.04服务器开启路由转发让局域网内其他电脑通过该服务器连接外网

    背景 今天想让一台装有 Ubuntu20.04 系统的服务器在局域网中起到路由器的功能。 目标: 让局域网中所有的电脑都通过这台服务器连接外网。 服务器网卡 服务器的两个网卡: eth0 : 192.168.1.xxx/24 连接局域网 eth1 : 117.22.22.xxx/24 连接外网 基本配置 1、在服务器上开启内核路由转

    2024年02月11日
    浏览(77)
  • Linux | Ubuntu20.04系统使用命令从移动硬盘/U盘拷贝文件到服务器上

    *确认自己移动硬盘、U盘的格式,本文为exfat格式 查看disk默认位置 查看最后的位置,我的显示为 Device, 位置为 /dev/sdb1 ,2048, (后面省略) *注意:此时无法直接查看硬盘内容 进入Linux系统主界面,如果是user的话,获取管理员权限 挂载移动硬盘/U盘 命令如下,其中/dev/sdb1为disk默

    2024年02月14日
    浏览(56)
  • nvidia驱动 && docker镜像cuda ,anaconda,pytorch下载ubuntu20.04&&pycharm远程连接远端服务器docker中的conda环境(完整操作)

    内含一整套操作,从设置容器到远程连接。 操作环境: 服务器:ubuntu 20.04 本机:win10 IDE:pycharm 专业版 下载驱动很容易的,下面我们来介绍一种最简单的方法。    插个小曲,删除驱动代码 参考网站里有很详细的解说,我们只再列出需要的代码。  当输入这个命令时 sudo d

    2024年02月04日
    浏览(63)
  • ubuntu20.04.3配置DHCP服务器

    实验环境:virtualbox 两台虚拟机:一台ubuntu服务器,一台win7客户机。 虚拟机的网络设置:“内部网络”,在混杂模式中选全部允许。win7也照此设置。  此模式下,虚拟机之间可以互相通信,但宿主机与虚拟机之间不能互相通信,暂时没找到解决办法, 有知道解决办法的可以

    2024年02月12日
    浏览(44)
  • Ubuntu20.04.5配置nfs服务器并自动挂载

    两台Ubuntu20.04.5版本的操作系统 分别当作一台服务器,一台客户机 1.服务器端(主机名我的是ceph01) 1.1安装nfs服务 apt install nfs-kernel-server 1.2 查看nfs版本 cat /proc/fs/nfsd/versions 安装完成后,NFS 服务将会自动启动,默认在Ubuntu 20.04上NFS2 被禁用,NFS3和NFS4以上可以使用。 查看NFS的版

    2024年02月06日
    浏览(74)
  • 尝试:解决华为matebook14安装ubuntu20.04 没有声音输出

    第一种情况(也是最常见的解决办法)   打开终端:输入  加载完成以后,输入: 如果无法在终端打开pavucontrol,可以尝试其他解决办法: 在ubuntu自带的Ubuntu Software中,搜索PulseAudio 出现如下几个音量控制软件,挨个下载安装看是否能打开   我在这里用的第二个,发现可以

    2023年04月12日
    浏览(70)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包