在Slurm 17.11版本中,你可以使用--spread-job选项来实现相同重复作业的分配到相对空闲的节点上。

--spread-job选项可用于与--array--requeue选项一起使用。它将尝试将相同重复作业的实例分配到相对空闲的节点上,从而实现负载均衡。

以下是使用--spread-job选项的示例命令:

sbatch --array=1-10%2 --spread-job my_script.sh

上述命令将提交一个数组作业,其中有10个实例,每2个实例为一个重复作业。--spread-job选项将尝试将相同重复作业的实例分配到相对空闲的节点上。

请注意,--spread-job选项只能在Slurm 17.11版本及更高版本中使用。如果你的Slurm版本较低,你可能需要升级到最新版本来使用此选项。

在Slurm 1711版本中我想实现相同重复作业进行作业分配时选择相对空闲的节点

原文地址: https://www.cveoy.top/t/topic/hK93 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录