我是秃鹰的新手。我正在使用no来做我对condor的主项目。覆盆子pi。目前我已将两个pi连接在一起的神鹰池中;我指的是#34; http://research.cs.wisc.edu/htcondor/tutorials/fermi-2005/simple_dag.html"网站运营一份工作。 但问题是作业正在提交机器上运行。
有人可以帮我解决这个问题。这将是一个很大的帮助。
提交文件
Universe = vanilla
Executable = simple
should_transfer_files = yes
when_to_transfer_output = on_exit
MultiCPUJob = True
transfer_input_files = simple.dag
Arguments = 4 10
Log = simple.log
Output = simple.out
Error = simple.error
Queue
日志文件
pi@raspberrypi:~/job $ cat simple.log
000 (012.000.000) 02/25 06:00:21 Job submitted from host: <10.0.101.122:46766>
DAG Node: simple
...
001 (012.000.000) 02/25 06:00:31 Job executing on host: <10.0.101.122:36154>
...
006 (012.000.000) 02/25 06:00:35 Image size of job updated: 7
0 - MemoryUsage of job (MB)
0 - ResidentSetSize of job (KB)
...
005 (012.000.000) 02/25 06:00:36 Job terminated.
(1) Normal termination (return value 0)
Usr 0 00:00:00, Sys 0 00:00:00 - Run Remote Usage
Usr 0 00:00:00, Sys 0 00:00:00 - Run Local Usage
Usr 0 00:00:00, Sys 0 00:00:00 - Total Remote Usage
Usr 0 00:00:00, Sys 0 00:00:00 - Total Local Usage
56 - Run Bytes Sent By Job
6230 - Run Bytes Received By Job
56 - Total Bytes Sent By Job
6230 - Total Bytes Received By Job
Partitionable Resources : Usage Request Allocated
Cpus : 1 1
Disk (KB) : 14 10 76532
Memory (MB) : 0 1 434
...
pi@raspberrypi:~/job $
答案 0 :(得分:0)
如果作业在提交机器上运行,它必须运行STARTD以及SCHEDD,NEG等...如果你不需要它,那么你可以在/ etc / condor中关闭它/ condor_config(或condor_config.local,具体取决于设置)。
如果您希望提交节点能够运行某些作业,而不是这些作业,那么您可以指定
要求= TARGET.Machine==foo@bar.com
强制它在特定计算机上运行,或者使用任何特定于您的要求的过滤掉该提交节点的任何内容,使用ClassAds作为起始节点(使用condor_status -l查看这些节点)。您可以在配置文件中自己指定这些ClassAd,然后使用它们来设置作业的要求。例如 启动节点:condor_config.local POOL = start_pool
SubmitNode:submit.dag 需求= POOL == “start_pool” 给自己更好的定制。