单节点多任务并行运行:Slurm 配置指南
以下是一个支持单节点多任务同时进行的Slurm配置示例:
-
首先,确保你已经安装并正确配置了Slurm。
-
打开Slurm配置文件 'slurm.conf',并添加以下配置:
# 全局配置
TaskPlugin=task/cgroup
# 节点配置
NodeName=node1 NodeAddr=192.168.1.1 CPUs=4 RealMemory=8000 Sockets=1 CoresPerSocket=4 ThreadsPerCore=1 State=UNKNOWN
# 分区配置
PartitionName=multi-task Nodes=node1 Default=YES MaxTime=24:00:00 State=UP
# 多任务配置
SelectType=select/cons_res
SelectTypeParameters=CR_Core
# 配置单节点多任务并行
TaskPluginParam=CGroupMountPoint=/sys/fs/cgroup/cpu, CGroupAutomount=yes, CGroupEnable=yes
-
保存并关闭配置文件。
-
重启Slurm服务以使配置更改生效。
现在,你可以使用以下命令提交多个任务并在单个节点上同时运行:
srun -N1 -n1 -c4 your_command_1
srun -N1 -n1 -c4 your_command_2
srun -N1 -n1 -c4 your_command_3
每个任务都将在单个节点上的4个CPU核心上并行运行。
注意:在配置Slurm时,确保节点的CPU和内存配置与实际硬件匹配,并根据需要调整其他参数。
原文地址: https://www.cveoy.top/t/topic/GRh 著作权归作者所有。请勿转载和采集!