多个核上的并行处理在某些进程上失败

时间:2014-10-30 08:52:23

标签: bash parallel-processing multicore

我在64核多群集上遇到以下问题。 我尝试运行一个bash文件,如下所示:

nohup command01 > nohup.output01 &
nohup command02 > nohup.output02 &
...
nohup command50 > nohup.output50 &

但是,如果我查看输出文件或使用htop命令,似乎我的50个作业中只有大约40个正在运行。它似乎只是随机的,50个中的哪一个被选择/处理。其他人已经开始了(输出文件中写了几行),但突然停了下来。我试图将数字减少到30,20 ...总是丢失一些工作。 现在我正在运行前10个,启动了那些,我再做10个 - 这似乎有效(并行20个工作)。但它很烦人。所以我的问题是:如何才能实现,并非所有50个作业都可以在64核多集群上并行处理,我可以做任何事情来实现它吗? 我无法在输出中发现任何错误。 谢谢你的帮助,B。

0 个答案:

没有答案