在Slurm 1711版本中我想实现相同重复作业进行作业分配时选择相对空闲的节点
在Slurm 17.11版本中,你可以使用--spread-job选项来实现相同重复作业的分配到相对空闲的节点上。
--spread-job选项可用于与--array或--requeue选项一起使用。它将尝试将相同重复作业的实例分配到相对空闲的节点上,从而实现负载均衡。
以下是使用--spread-job选项的示例命令:
sbatch --array=1-10%2 --spread-job my_script.sh
上述命令将提交一个数组作业,其中有10个实例,每2个实例为一个重复作业。--spread-job选项将尝试将相同重复作业的实例分配到相对空闲的节点上。
请注意,--spread-job选项只能在Slurm 17.11版本及更高版本中使用。如果你的Slurm版本较低,你可能需要升级到最新版本来使用此选项。
原文地址: https://www.cveoy.top/t/topic/hK93 著作权归作者所有。请勿转载和采集!