什么是AssocGrpNodeLimit
? squeue
命令显示它列为我的工作尚未运行的“原因”。我很惊讶,因为有些节点是空闲的。我的首要任务是我见过的最高点(2126)。我用谷歌搜索并将其绑定,我发现它是slurm_protocol_defs.c中的返回值:
/* Given a job's reason for waiting, return a descriptive string */
extern char *job_reason_string(enum job_state_reason inx)
{
...
case WAIT_ASSOC_GRP_NODE:
return "AssocGrpNodeLimit";
基于包含“AssocGrpNodeLimit”的单词和单词片段,我猜测与我同一组关联的人使用了太多节点,所以我的作业不会运行?
答案 0 :(得分:3)
AssocGrpNodeLimit是为提交作业的关联设置的节点数限制。
您可以使用squeue -A <account_name>
查看限制,如果不受管理员限制,您还可以使用 $('.list').on("click", ".remove", function () {
$(this).parent().remove();
});
来自http://slurm.schedmd.com/sacctmgr.html的术语关联的定义(原文强调):
基于形成所谓的关联的四个参数记录Slurm帐户信息。这些参数是 用户,群集,分区和帐户。 user 是登录名。 簇 是 ClusterName 指定的Slurm托管集群的名称 slurm.conf 配置文件中的参数。 partition 是名称 该群集上的Slurm分区。 帐户是银行帐户 一份工作。