无法在SGE集群中使用/ path / to / job_submit_dir /

时间:2015-01-31 11:05:27

标签: parallel-processing sungridengine

我使用qsub向SGE群集提交作业。在作业文件中,定义了以下内容:

    #!/bin/bash
    #
    #$ -V
    #$ -cwd
    #$ -j y
    #$ -S /bin/bash
    #

-cwd表示作业将在作业文件所在的目录中运行。所有作业文件都包含上面的作业设置。

部分作业已提交且可以正常运行,但部分作业已提交且qstat的状态为Eqw,并且在使用qstat -j job_id显示详细状态时,它显示:

    failed changing into working directory because: 
    error: can't chdir to /path/to/job_submit_dir

但有时我会进入目录,然后重新提交作业,它似乎有效。

我在Google上搜索过,this site提供了一个解决方案,但它对我的设置无效。

请问有人可以提出一些建议吗?

1 个答案:

答案 0 :(得分:1)

似乎对于此错误的实例,问题可能是由于对网络安装存储的过多写入:

https://www.icts.uiowa.edu/confluence/display/ICTSit/Best+practices+for+high+throughput+jobs

解决尝试将输出重定向到每个执行节点上的本地存储或/dev/null