监控StarCluster / Sun Grid Engine群集性能

时间:2014-08-28 22:29:18

标签: performance amazon-ec2 cluster-computing sungridengine starcluster

我使用StarCluster和SGE有点新鲜。我想知道监视“群集性能”的最佳做法是什么,即确定群集在某个单位时间内可以运行的特定作业的数量。我熟悉qstat命令,但它只显示每个作业的状态。我想我的用例是提交X作业并知道所有X完成所需的时间。是否有一种简单易用的方法可以做到这一点,还是我必须写一个scipt才能做到这一点?

现在我正在为每个实例使用Ubuntu 12.04。

非常感谢!

1 个答案:

答案 0 :(得分:0)

像这样的一个简单的bash脚本+一个时间命令就足够了。

lines=999
while [ $lines -ne 0 ]; do
    sleep 1;
    lines=`qstat -u "*" | wc -l`;
    done;

只要队列不为空,此脚本就会循环。如果您调用脚本“queue_watch.sh”,则启动作业,然后运行命令

time bash queue_watch.sh

那应该这样做。