Slurm 中处理计算节点不同用户名和文件访问问题
在 Slurm 中,如果计算节点上的路径下没有文件,需要先在计算节点上创建相应的文件,以便任务能够访问它们。可以使用以下命令在计算节点上创建文件:
srun -N <node_count> -n <task_count> -w <node_name> touch <file_path>
在上面的命令中,<node_count> 表示节点数量,<task_count> 表示任务数量,<node_name> 表示节点名称,<file_path> 表示要创建的文件路径。
对于节点用户名不一致的情况,可以通过在 Slurm 配置文件中指定节点的用户名来解决。可以在 /etc/slurm-llnl/slurm.conf 文件中添加以下行:
NodeName=node1 Procs=2 RealMemory=1000 State=UNKNOWN NodeHostName=node1 NodeAddr=192.168.0.1 Sockets=1 CoresPerSocket=2 ThreadsPerCore=1 SocketsPerBoard=1 Boards=1 Gres=gpu:2 UserName=user1
在上面的配置中,NodeName 表示节点名称,UserName 表示节点的用户名。可以为每个节点指定不同的用户名。
然后,可以使用以下命令在计算节点上运行任务:
srun -N <node_count> -n <task_count> -w <node_name> -u <node_username> <command>
在上面的命令中,<node_count>、<task_count>、<node_name> 与上面的命令相同,<node_username> 表示节点的用户名,<command> 表示要运行的命令。
原文地址: https://www.cveoy.top/t/topic/oYkH 著作权归作者所有。请勿转载和采集!