获取SLURM作业GPU信息并修改脚本
#!/bin/bash
获取每个GPU分配的资源
gres_per_gpu=$(/usr/bin/scontrol show job $SLURM_JOB_ID | grep -oP 'gres/gpu=\K[^,]+')
获取分配的节点数量
num_nodes=$(/usr/bin/scontrol show job $SLURM_JOB_ID | grep -oP 'NumNodes=\K[^ ]+')
计算分配的GPU数量
gpu_count=$((gres_per_gpu / num_nodes))
获取分配的主机列表
hosts=$(/usr/bin/scontrol show hostnames $SLURM_JOB_NODELIST)
循环遍历每个主机,并将GPU数量附加到主机字符串
for host in $hosts; do sed -i 's/$host/$host:$gpu_count/' '$1' done
原文地址: https://www.cveoy.top/t/topic/ef75 著作权归作者所有。请勿转载和采集!