北京超级云计算GPU服务器的使用教程

这篇具有很好参考价值的文章主要介绍了北京超级云计算GPU服务器的使用教程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

北京超级云计算中心(北京超算云)是一个很不错的训练深度学习模型的平台(主要是可以白嫖200元的GPU算力资源),官网连接。申请账号现在应该还送200元(我申请使用的是GPU服务器)。在官网中填写申请信息,然后等着客户经理给你打电话,然后把你的需求说清楚,第二天就能拿到账号了!!
注意:注册好的账号和平台使用说明,会通过邮箱发送给你。

一、拿到账号之后,开始进行如下操作:
①在官网下载并安装PC客户端,安装好并登录自己的账号,如图所示
北京云超算 使用手册,各类软件的使用技巧以及避免踩坑,深度学习

②点击SSH软件登陆——>点击 连接
北京云超算 使用手册,各类软件的使用技巧以及避免踩坑,深度学习

③出现此界面表示登陆成功。(此界面开头的一段文字简单的告诉了用户北京超算云的使用规则)
北京云超算 使用手册,各类软件的使用技巧以及避免踩坑,深度学习

二、上传需要训练的模型的文件夹
①首先先要在自己的电脑上将代码都编写好,我个人使用的是YOLOv5_5.0的版本进行训练的,那就以它为例子进行讲解了。
北京云超算 使用手册,各类软件的使用技巧以及避免踩坑,深度学习

②打开winscp软件,进行文件传输,将本地电脑上准备训练的代码、数据集等文件夹上传到超算云的服务器中(涉密数据集尽量不要传)
北京云超算 使用手册,各类软件的使用技巧以及避免踩坑,深度学习
连接上去之后的界面:
北京云超算 使用手册,各类软件的使用技巧以及避免踩坑,深度学习
此时要注意右边界面的路径,一定要点进去run文件夹里面,然后再进行文件传输,传输完的效果如下:
北京云超算 使用手册,各类软件的使用技巧以及避免踩坑,深度学习

三、编写训练脚本(.sh类型的)
这个根据每个人的模型的不同而不同,可以请平台的工程师替你编写一个。
以我的为例:

#!/bin/bash
module load anaconda/2020.11
module load cuda/11.4
source activate torch1.10
export PYTHONUNBUFFERED=1
python train.py


四、进行模型的训练
①首先安装自己要训练模型的依赖库(打开超算云桌面上的SSH,在SSH界面中安装)
还是以YOLOv5_5.0为例子
1、加载 anaconda/2020.11。
module load anaconda/2020.11
2、创建一个名为torch.10(名字可以自己起,必须是英文的)的虚拟环境,python使用3.8的版本。
conda creat -n torch1.10 Python=3.8
3、创建完成后,激活虚拟环境(后续的操作都是在该虚拟环境下进行的)
先查看已经安装的环境
conda env list (得到的输出,带*号的代表目前激活的环境)
使用 source activate torch1.10 (激活刚才创建的虚拟环境)
4、根据模型的依赖库 自己安装即可
yolov5_5.0所需的环境:

pip install -r requirements.txt

base ----------------------------------------

matplotlib>=3.2.2
numpy>=1.18.5
opencv-python>=4.1.2
Pillow
PyYAML>=5.3.1
scipy>=1.4.1
torch>=1.7.0
torchvision>=0.8.1
tqdm>=4.41.0

logging -------------------------------------

tensorboard>=2.4.1

wandb

plotting ------------------------------------

seaborn>=0.11.0
pandas

export --------------------------------------

coremltools>=4.1

onnx>=1.8.1

scikit-learn==0.19.2 # for coreml quantization

extras --------------------------------------

thop # FLOPS computation
pycocotools>=2.0 # COCO mAP

五、开始训练
打开超算云的SSH软件,依次输入以下命令

module load anaconda/2020.11
conda env list
source activate torch.10
cd 所在文件夹路径 (我的就是:cd /data/run01/scz1352/YOLOv5-5.0)
sbatch --gpus=1 ./sub.sh

然后就可顺利训练了文章来源地址https://www.toymoban.com/news/detail-788521.html

到了这里,关于北京超级云计算GPU服务器的使用教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 阿里云异构计算GPU、FPGA、EAIS云服务器详细介绍说明

    阿里云阿里云异构计算主要包括GPU云服务器、FPGA云服务器和弹性加速计算实例EAIS,随着人工智能技术的发展,越来越多的AI计算都采用异构计算来实现性能加速,阿里云异构计算云服务研发了云端AI加速器,通过统一的框架同时支持了TensorFlow、PyTorch、MXNet和Caffe四种主流AI计

    2024年02月09日
    浏览(31)
  • 腾讯云国际代充-GPU服务器安装驱动教程NVIDIA Tesla

    腾讯云国际站GPU 云服务器是基于 GPU 的快速、稳定、弹性的计算服务,主要应用于深度学习训练/推理、图形图像处理以及科学计算等场景。 GPU 云服务器提供和标准腾讯云国际 CVM 云服务器一致的方便快捷的管理方式。 GPU 云服务器通过其强大的快速处理海量数据的计算性能,

    2024年02月10日
    浏览(53)
  • 本地连接服务器使用GPU训练模型

    直接运行上面的文件,然后输入密码,这密码不是服务器的密码,但是可以直接连接到服务器上面,这个东西是什么?好厉害,居然可以跳过去服务器的账号密码 我本来想忽略一些不需要上传文件,但是无法成功忽略,scp好像不支持 下面这个命令是从服务器上面传输数据到

    2024年02月07日
    浏览(40)
  • 教你如何使用云服务器搭建我的世界Minecraft服务器(超级简单-10分钟完成)

    一个人玩游戏没啥意思,和朋友一块联机呢,距离太远,家庭局域网宽带又没有公网ip,你的朋友没办法与你联机,然而你只需要一台服务器即可搞定了;但是很多用户没没接触过相关的内容,具体的该怎么操作呢?下面我将吧详细的教程分享给大家,适合完全零基础,跟着

    2024年02月07日
    浏览(41)
  • 服务器已经存在CUDA但无法使用GPU

    记录一下我使用服务器期间遇到的问题以及解决方法(主要使用tensorflow) 先介绍一下我本次遇到的问题: 我在服务器上拥有一个独立的账号,我发现我的tensorflow无法调用GPU,先排查可能存在的问题 终端输入 nvcc -V 结果如下: 显示已经安装了11.8版本的CUDA  但是在python文件

    2024年02月02日
    浏览(35)
  • 如何在服务器使用GPU跑深度学习代码

    每个人都有他们偏好的工具和工作流程。就我个人而言,我喜欢使用 PyCharm Professional Edition 作为我的集成开发环境,选择使用 HengYuan Cloud\\\'s OSS.exe 和 FileZilla 进行文件传输,并且我倾向于使用 Xshell 来处理命令行操作。这些工具的组合满足了我的所有需求,并使我的工作效率最

    2024年04月12日
    浏览(41)
  • 恒源云 & PyCharm!!!深度学习在恒源云上租服务器并进行远程连接超级详细教程!!!(个人学习记录)

    本人因为实验需要,经常在网上租服务。之前用过Autodl平台,也出了相关教程Autodl使用教程。因为Autodl上面的卡空闲的比较少,而且都比较贵,最近发现了恒源云这个新平台。感觉上面服务器的普遍比Autodl上的便宜(没有严格对比),但是恒源云也存在一个问题,就是租一个

    2024年04月22日
    浏览(45)
  • (一)ssh远程连接服务器GPU以及其他GPU使用途径——新手指南

    最近在训练语义分割网络时决定使用GPU,本文记录新手在使用GPU时遇到的一些坑。想要在win10系统上配置GPU运行Pytorch代码可以考虑以下几种方式: 安装cuda,以及GPU版本的pytorch和torchvision,使用电脑自带的GPU进行网络训练; 远程连接实验室的服务器,通过IP、账号以及密码进

    2024年02月08日
    浏览(33)
  • 利用Google Colab免费使用GPU服务器详细攻略

    目录 前言 一、Colab限额、提供的GPU类型 二、Colab的使用步骤(如何使用免费GPU资源) 1、添加Colaboratory 2、新建Colab、连接GPU、挂载Google Driver 3、项目上传文件并运行 三、快速下载/上传Google Drive文件的方法(利用MultiCloud) 四、其他相关技巧 Google Colab是一个基于云端的免费

    2024年02月09日
    浏览(38)
  • 配置使用云服务器训练神经网络模型——在阿里GPU服务器训练yolov5模型

    对于没有GPU训练机的人来讲,使用云服务器训练自己的模型应该最最优选择,只是在训练的时候开个按时计费的服务器,训练完成后保存环境镜像之后,可以完全停掉服务器,期间不产生任何费用,下次再训练时,启动环境就可以,很容易保护好自己的训练环境不受污染。

    2024年02月06日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包