我最近尝试配置HTcondor。我设法提交了连续(Vanilla Universe)工作,没有任何错误或问题。但是,当我尝试提交并行(并行Universe)作业时,工作似乎永远停留在队列中。
***提交文件代码:
universe = parallel
executable = SommeP
output = outputP.$(NODE)
error = errorP.$(NODE)
log = logP
machine_count = 4
should_transfer_files = yes
when_to_transfer_output = on_exit
queue
*** Condor_q
*** Condor_status(1个Master 2 Slaves 6个插槽) enter image description here
答案 0 :(得分:1)
您的condor池的管理员必须配置执行节点,以便在调度Parallel Universe作业之前将您的提交节点视为专用调度程序。有关详细信息,请参阅手册中的“并行应用程序”部分:http://research.cs.wisc.edu/htcondor/manual/current/2_9Parallel_Applications.html#SECTION00392000000000000000