Ubuntu服务器安装配置slurm (Ubuntu 22.04 LTS)

这篇具有很好参考价值的文章主要介绍了Ubuntu服务器安装配置slurm (Ubuntu 22.04 LTS)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Ubuntu服务器安装配置slurm (Ubuntu 22.04 LTS)

1. slurm简介

Slurm 全称 Simple Linux Utility for Resource Management。通常被用于大型Linux服务器 (超算) 上,作为任务管理系统。本文详细讲述如何在 Ubuntu 22.04 LTS 上安装slurm,并进行简单的配置。

其实网上相关的教程已经非常多,但在旧版本的Ubuntu上安装slurm时,通常需要安装一个名为slurm-llnl的软件包。但Ubuntu 22.04 LTS 的软件源不包含slurm-llnl,强行安装就会报出如下的错误:

$ sudo apt install slurm-llnl
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
E: Unable to locate package slurm-llnl

2. slurm的安装步骤

Step 1. 安装依赖的软件包

  1. slurmd: 完成计算节点的任务(启动任务、监控任务、分层通信)
  2. slurmctld: 完成管理节点的任务(故障切换、资源监控、队列管理、作业调度)
$ sudo apt update
$ sudo apt install slurm-wlm
# `slurmd`: compute node daemon
$ sudo apt install slrumd  (提示已安装)
# `slurmctld`: central management daemon
$ sudo apt install slurmctld  (提示已安装)

Step 2. 找到slurm-wlm-configurator.html文件,进入该目录下

# 输入以下命令,并
$ dpkg -L slurmctld | grep slurm-wlm-configurator.html
/usr/share/doc/slurmctld/slurm-wlm-configurator.html
$ cd /usr/share/doc/slurmctld
$ sudo chmod +r slurm-wlm-configurator.html

Step 3. 利用 web 生成配置文件

$ python3 -m http.server
Serving HTTP on 0.0.0.0 port 8000 (http://0.0.0.0:8000/) ...

打开浏览器,输入 http://:8000/,进入配置页面,点击进入 slurm-wlm-configurator.html 按照自己的需求填写设置。

Cluster Name:随意起名

Control Machines:控制节点的计算机名

Compute Machines:计算机名、ip地址、分区名和任务时间限制

cpus:虚拟机直接指定虚拟cpu数量

Sockets: 物理机不指定cpus,指定cpu插槽

CoresPerSocket: 物理机每个插槽有多少core

ThreadsPerCore: 物理机每个core有多少个线程,超线程的CPU此数字为2

slurmuser:指定为root用户

Process Tracking:选择 LinuxProc: Use parent process ID records, processes can escape from Slurm control

web 生成slurm.conf

填写完毕后,点击submit,将生成的内容拷贝进 /etc/slurm/slurm.conf (slurm 的配置文件)

# 创建
$ sudo touch /etc/slurm/slurm.conf
# 将网页生成的内容 copy 进来
$ sudo vim /etc/slurm/slurm.conf
# ctrl + v

Step 4. 手动创建slurm的输出文件目录

$ sudo mkdir /var/spool/slurmd
$ sudo mkdir /var/spool/slurmctld

Step 5. 启动 slurm 服务

# 启动 slurmd, 日志文件路径为 `/var/log/slurmd.log`
$ sudo systemctl start slurmd
# 启动 slurmctld, 日志文件路径为 `/var/log/slurmctld.log`
$ sudo systemctl start slurmctld

启动后无法正常使用 slurm 的话,先查看slurmd和slurmctld的状态,打开日志查看报错。

# 查看 slurmd 的状态
$ sudo systemctl status slurmd
# 查看 slurmctld 的状态
$ sudo systemctl status slurmctld

3. slurm.conf 中几个关键 column 的填写

C1. ClusterName

集群名,随便取

C2. SlurmctldHost

管理节点的主机名

# 获取主机名
$ hostname -s
mu01

C3. SlurmUser

最好 SlurmUser=root,权限最高,填写日志文件不会由于权限问题报错

C4. 管理节点和计算节点的配置(slurm.conf的最后三行)

此处以单节点集群举例(单个节点既作为管理节点,又作为计算节点)

EnforcePartLimits=ALL
NodeName=mu01 CPUs=36 State=UNKNOWN     # 本行可以通过 `slurmd -C` 获取
PartitionName=compute Nodes=mu01 Default=YES  MaxTime=INFINITE State=UP   # 创建一个名为compute的队列

slurmd -C 的输出:

$ slurmd -C
NodeName=mu01 CPUs=36 Boards=1 SocketsPerBoard=1 CoresPerSocket=10 ThreadsPerCore=2 RealMemory=63962

脚本内容111.sh

#!/bin/bash
#SBATCH -p debug
#SBATCH -J test
#SBATCH -N 1
#SBATCH -n 4
#SBATCH -o out.log
#SBATCH -e error.log

mpirun -np 4 vasp_std

作业提交命令:(在slurm安装配置完成,提交作业之前需要重启一次服务器)

sbatch -n 4 111.sh

sbatch 111.sh

作业队列:squeue

作业状态:sinfo

作业输出:tail -f out.log文章来源地址https://www.toymoban.com/news/detail-731930.html

到了这里,关于Ubuntu服务器安装配置slurm (Ubuntu 22.04 LTS)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 在 ubuntu 22.04 上配置界面服务器 xrdp

    安装 vnc 服务器 和 xrdp 服务器 配置 ~/.xsession

    2024年02月07日
    浏览(43)
  • Ubuntu22.04服务器版本配置静态IP地址

    1、进入文件/etc/netplan/00-installer-config.yam 2、配置文件内容  注意:编写文件内容时一定要格式正确,不然会出差 3、重启网络  4、查看IP  这样就配置成功啦 5、如果是18.04一下版本参照这个配置,22.04版本也可以用这个,重启网络的时候会有报错,但不会有影响  重启网络后

    2024年02月11日
    浏览(51)
  • Ubuntu22.04 安装深度学习服务器全纪录

    制作启动盘 参考链接:https://blog.csdn.net/lyx_ok/article/details/129308753 安装 Ubuntu 22.04 将U盘插到服务器上,开机按F11键(具体什么键跟主板型号有关)选择启动项进入临时的 Ubuntu 系统,在图形界面中选择 Install Ubuntu ,所有配置都可以使用默认的,改一下用户名和密码即可。 进入

    2024年02月16日
    浏览(47)
  • Ubuntu最新版本(Ubuntu22.04LTS)安装nfs服务器

    NFS(Network File System)是一种允许不同计算机之间共享文件的网络文件系统。 在Ubuntu 22.04 LTS中,您可以使用以下步骤安装并配置NFS服务器。 一、安装NFS服务器 在Ubuntu 22.04 LTS中,您可以使用以下命令安装NFS服务器: 二、创建共享目录 接下来,您需要创建要共享的目录。在本

    2024年02月05日
    浏览(53)
  • 服务器Ubuntu 22.04 64位安装 MySQL5.7

    官网地址 这里选择下载5.7.29的ubuntu版本注意是amd64不是arm64,或者执行下面命令 解压下载下来的包 ls一下看看有什么 我们先安装这个 然后再装下一个 喜闻乐见的报错,说我们没有安装红圈里的两个,我们去安装 好嘛,server依赖client,client又缺少libtinfo5,那就不能先装clien

    2024年02月06日
    浏览(49)
  • ubuntu22.04配置双网卡双静态ip不通网段访问服务器的相同服务

    ubuntu22.04配置双网卡双静态ip不通网段访问服务器的相同服务 技术博客 http://idea.coderyj.com/ 1.需求 南方电网网段(假如)是 192.168.3.1的网段 机器人服务器在隧道ip是 172.16.1.1网段 要求这2个网段都能访问到服务器上的服务 2.解决方案 服务器上配置双网卡 双ip 以ubuntu22.04为例 vim /e

    2024年02月12日
    浏览(59)
  • ubuntu22.04服务器的双网卡绑定的具体操作步骤和配置文件

    ubuntu22.04服务器的双网卡绑定具体步骤可以分成以下五步,下面按步骤操作 将原内容 修改为 这种方式为自动获取IP的方式,系统将通过连接的DHCP服务器自动获取其IP地址,其中enp1s0,enp7s0为网卡名称,通过ifconfig命令查看 或者使用以下的内容替换对应的IP地址,可以设置固定的局域网

    2024年02月09日
    浏览(61)
  • Ubuntu 22.04网络配置指南:如何设置静态IP和自定义DNS服务器

    找到并打开Netplan配置文件 : 在Ubuntu终端中,输入以下命令来编辑Netplan的配置文件: 请确保文件名与您系统中实际的文件名匹配。 更新配置文件 : 使用以下内容替换文件中的内容(根据实际情况调整接口名称 enp0s3 、IP地址、网关和DNS服务器): 在这个配置中: enp0s3 是网

    2024年04月11日
    浏览(51)
  • 7、云服务器、WSL2(Widnows)Ubuntu22.04、安装图形界面/桌面xfce4、vnc连接、设置中文桌面、配置中文输入法、安装浏览器和文本编辑器、终端、解决客户端和服务器桌面复制黏贴问题

    0.1、备注 以下方式适用于云服务器和WSL2(适用于Linux的windows子系统)Ubuntu22.02 0.2、说明 在 Ubuntu 服务器上安装图形界面可以让你通过图形化的方式管理和操作系统。 Ubuntu 提供了多种图形界面选择,以下是一些常见的图形界面: GNOME:GNOME 是 Ubuntu 默认的图形界面环境,它提

    2024年02月20日
    浏览(64)
  • ubuntu 22.04搭建OpenVPN服务器

    为了公司与分公司之前的内部服务器和办公电脑之间能够相互访问,打算使用VPN,对于VPN,以前用得多的是PPTP; 但是PPTP相对于openvpn来说,没有openvpn安全,而且PPTP在linux下命令行支持不是很好,稳定性也不如openvpn。所以最后就选择openvpn来搭建VPN. 如上图所示,红线为VPN访问效

    2024年02月14日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包