#!/bin/bash

获取每个GPU分配的资源

gres_per_gpu=$(/usr/bin/scontrol show job $SLURM_JOB_ID | grep -oP 'gres/gpu=\K[^,]+')

获取分配的节点数量

num_nodes=$(/usr/bin/scontrol show job $SLURM_JOB_ID | grep -oP 'NumNodes=\K[^ ]+')

计算分配的GPU数量

gpu_count=$((gres_per_gpu / num_nodes))

获取分配的主机列表

hosts=$(/usr/bin/scontrol show hostnames $SLURM_JOB_NODELIST)

循环遍历每个主机,并将GPU数量附加到主机字符串

for host in $hosts; do sed -i 's/$host/$host:$gpu_count/' '$1' done

获取SLURM作业GPU信息并修改脚本

原文地址: https://www.cveoy.top/t/topic/ef75 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录