工作永远陷入队列(Condor - Parallel Universe)

时间:2018-01-16 19:49:48

标签: condor

我最近尝试配置HTcondor。我设法提交了连续(Vanilla Universe)工作,没有任何错误或问题。但是,当我尝试提交并行(并行Universe)作业时,工作似乎永远停留在队列中。

***提交文件代码:

universe = parallel
executable = SommeP
output = outputP.$(NODE)
error = errorP.$(NODE)
log = logP
machine_count = 4
should_transfer_files = yes
when_to_transfer_output = on_exit
queue

*** Condor_q

enter image description here

*** Condor_status(1个Master 2 Slaves 6个插槽) enter image description here

1 个答案:

答案 0 :(得分:1)

您的condor池的管理员必须配置执行节点,以便在调度Parallel Universe作业之前将您的提交节点视为专用调度程序。有关详细信息,请参阅手册中的“并行应用程序”部分:http://research.cs.wisc.edu/htcondor/manual/current/2_9Parallel_Applications.html#SECTION00392000000000000000