以下是一个支持单节点多任务同时进行的Slurm配置示例:

  1. 首先,确保你已经安装并正确配置了Slurm。

  2. 打开Slurm配置文件 'slurm.conf',并添加以下配置:

# 全局配置
TaskPlugin=task/cgroup

# 节点配置
NodeName=node1 NodeAddr=192.168.1.1 CPUs=4 RealMemory=8000 Sockets=1 CoresPerSocket=4 ThreadsPerCore=1 State=UNKNOWN

# 分区配置
PartitionName=multi-task Nodes=node1 Default=YES MaxTime=24:00:00 State=UP

# 多任务配置
SelectType=select/cons_res
SelectTypeParameters=CR_Core

# 配置单节点多任务并行
TaskPluginParam=CGroupMountPoint=/sys/fs/cgroup/cpu, CGroupAutomount=yes, CGroupEnable=yes
  1. 保存并关闭配置文件。

  2. 重启Slurm服务以使配置更改生效。

现在,你可以使用以下命令提交多个任务并在单个节点上同时运行:

srun -N1 -n1 -c4 your_command_1
srun -N1 -n1 -c4 your_command_2
srun -N1 -n1 -c4 your_command_3

每个任务都将在单个节点上的4个CPU核心上并行运行。

注意:在配置Slurm时,确保节点的CPU和内存配置与实际硬件匹配,并根据需要调整其他参数。

单节点多任务并行运行:Slurm 配置指南

原文地址: https://www.cveoy.top/t/topic/GRh 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录