PBSPro错误的QList条目结果处于Q状态

时间:2018-07-04 15:13:51

标签: job-scheduling pbs

我们正在使用qlist将运行划分为由特定用户组提交的一组节点。整个集群都通过一个chron作业进行了测试,该作业循环遍历所有节点,并且必须为每个作业指定相关的qlist,否则该作业将进入Q状态,并带有注释“未运行:资源不足:Qlist”

如果作业进入失败状态而不是挂在Q状态,那么从测试的角度来处理这种用户错误情况将更加容易。似乎任何时候发生“资源不足”情况,PBSPro都会使工作失败。为什么Q表示显然不会从Q中消失的故障?有没有办法改变这种行为?

1 个答案:

答案 0 :(得分:0)

同事(R. Powell)解释说,PBSPro通过排队工作(即等待资源可用)将所有不足的资源问题都视为“可纠正”。在这种情况下,调度程序正在等待节点Qlist条目更改,这不太实际。但是,始终如一地处理所有不足的资源问题是可以理解的。

还确定要运行一种更好的基于节点的测试方法

pbsnodes [nodename] | grep resources_available.Qlist

在运行实际测试作业时获取要应用的Qlist条目。