作业在 squeue 中显示为 BadConstraints 状态通常是由于以下原因之一引起的:

  1. 作业请求的资源超出了系统的可用资源范围。这可能是由于作业请求了过多的 CPU 核心、内存、GPU 等资源,而系统无法满足这些要求。

  2. 作业请求的资源与系统的约束条件不兼容。系统可能设置了一些约束条件,例如特定的节点、特定的分区等,如果作业的请求与这些约束条件不匹配,就会导致作业状态为 BadConstraints。

  3. 作业请求的资源与其他正在运行的作业冲突。如果系统中已经有其他作业正在使用所请求的资源,那么作业可能会被标记为 BadConstraints。

为了解决这个问题,您可以尝试以下方法:

  1. 检查作业请求的资源是否超出了系统的可用资源范围。您可以尝试减少作业请求的资源数量,或者等待系统资源空闲后再提交作业。

  2. 检查作业请求的资源与系统的约束条件是否兼容。您可以查看系统的约束条件,例如节点、分区等,并确保作业的请求与这些约束条件匹配。

  3. 检查是否有其他作业正在使用所请求的资源。您可以使用 squeue 命令查看当前正在运行的作业,以及它们所使用的资源。如果有其他作业正在使用所请求的资源,您可以等待这些作业完成后再提交您的作业。

squeue 查询作业是 BadConstraints 状态是因为什么原因引起的?

原文地址: https://www.cveoy.top/t/topic/i5rp 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录