作业从运行状态切换到排队并返回

时间:2017-06-30 12:54:56

标签: cluster-computing pbs torque

我们观察到这种奇怪的行为,在集群上运行扭矩pbs和maui上的一些工作:一些工作正在(R)unning和(Q)ueued状态之间切换。尝试谷歌周围,没有找到任何提示。可能是什么原因?值得注意的是,这些作业的性质不同:一些是使用TensorFlow和python,另一些是C ++可执行文件。

1 个答案:

答案 0 :(得分:0)

这里说不够,但我猜他们并没有真正跑步。 pbs_mom日志和系统日志应该提供线索。