我的工作消失得无影无踪

时间:2014-12-20 08:47:23

标签: parallel-processing mpi hpc qsub

我正在运行天气预报模型,我希望通过crontab自动执行modek运行。当我通过以下方式提交我的工作时:

qsub -I -l nodes=8:ppn=8 -l walltime=2:00:00

工作运行正常。 当我通过crontab提交时,作业消失而没有任何痕迹,没有任何错误文件,没有输出文件,除了邮件如下:

From: root@master.cluster (Cron Daemon)
To: test@master.cluster
Subject: Cron <test@master> PATH=/opt/torque/bin:/usr/bin:/bin:. qsub /home/test
/WRF/SCRIPTS/wrf_00_run.sh
Content-Type: text/plain; charset=UTF-8
Auto-Submitted: auto-generated
X-Cron-Env: <SHELL=/bin/sh>
X-Cron-Env: <HOME=/home/test>
X-Cron-Env: <PATH=/usr/bin:/bin>
X-Cron-Env: <LOGNAME=test>
X-Cron-Env: <USER=test>
Message-Id: <20141220080001.D0F6B5C08ED@master.cluster>
Date: Sat, 20 Dec 2014 10:00:01 +0200 (CAT)
152.master.cluster

这是我的crontab条目

50 09 * * * PATH=/opt/torque/bin:/usr/bin:/bin:. qsub /home/test/WRF/SCRIPTS/wrf_submit_00.sh

和wrf_submit_00.sh有两个依赖的作业连续运行

#!/bin/bash
cd WRF/WRFV3/run

FIRST =`qsub wrf_initialise.sh`
echo $FIRST
SECOND = `qsub -w depend=afterok:$FIRST wrf_00_run.sh`
echo $SECOND
exit 0

并且第一份工作是

#!/bin/bash
#PBS -l nodes=8:ppn=8
cd WRF/WRFV3/run
echo -n "this script is running on: "
hostname -f
date
echo ""
echo "### PBS_NODEFILE (${PBS_NODEFILE}) ###"
cat ${PBS_NODEFILE}
echo ""
mpirun ./real.exe
exit 0

当我通过crontab单独提交这两个作业时,我得到同样的消失。 请帮忙!,卡住了。谷歌搜索类似的问题没有任何线索。

0 个答案:

没有答案