第一次迭代后,当调用subshel​​l时,Bash while循环停止

时间:2016-05-13 02:01:52

标签: bash shell while-loop subshell

这个人为的bash脚本演示了这个问题。

#!/bin/bash
while read -r node ; do
    echo checking $node for Agent;
       PID=$(ssh $node ""ps -edf | grep [j]ava | awk '{print $2}'"")
       echo $PID got to here.
done < ~/agents_master.list

agents_master.list每行包含1个服务器:

server1
server2
server3

仅输出以下内容:

checking server1 for Agent
Authorized use only
25176 got to here

服务器2和3甚至无法通过行echo checking $node...

回显到屏幕

如果我注释掉PID=$(....行,那么while会正确完成整个agents_master.list文件......

checking server1 for Agent
got to here
checking server2 for Agent
got to here
checking server3 for Agent
got to here

通过谷歌搜索我已经完成,听起来这与$(...)创建的子shell有关,但我不明白为什么它导致循环停在第一台服务器上,server1

是的,这段代码可以重写,但我很想了解bash的这种行为以及为什么会发生这种情况。

1 个答案:

答案 0 :(得分:4)

问题 - 问题之一 - 是ssh将stdin转发到远程服务器。碰巧,您在远程服务器上运行的命令(ps -edf,见下文)不使用其标准输入,但ssh仍将转发它所读取的内容,以防万一。因此,read无需读取任何内容,因此循环结束。

为避免这种情况,请使用ssh -n(或自行将输入重定向到/dev/null,这是-n选项的作用。

还有一些其他问题实际上并没有干扰您的脚本执行。

首先,我不知道您为什么在

中使用""
ssh $node ""ps -edf | grep [j]ava | awk '{print $2}'""

""“扩展”为空字符串,因此上述内容实际上与

相同
ssh $node ps -edf | grep [j]ava | awk '{print $2}'

表示正在本地主机上运行grepawk命令; ps命令的输出由ssh转发回本地主机。这并没有改变任何东西,虽然它确实使[j]ava中的括号变得多余,因为grep不会出现在进程列表中,因为它没有在{{1}的主机上运行1}}被执行。实际上,括号是多余的是一件好事,因为如果当前工作目录中有一个名为ps的文件,它们可能不会出现在命令中。你真的应该引用那个论点。

我认为您打算在远程计算机上运行整个管道,在这种情况下您可能尝试过:

java

并发现它无法正常工作。它不会起作用,因为awk命令中的ssh $node "ps -edf | grep [j]ava | awk '{print $2}'" 将扩展为当前shell中的$2; $2 受内部单引号保护。就bash而言,$2只是双引号字符串的一部分。 (并且它还会将参数问题转移到$2没有被引用到远程主机,因此如果远程主机上的主目录中存在名为grep的文件,则会出现问题

所以你真正想要的是

java

最后,不要使用ssh -n $node 'ps -edf | grep "[j]ava" | awk "{print \$2}"' 作为shell变量的名称。所有大写的变量名通常都是保留的,它是危险的PIDBASHPID,它们是特定的bash变量。您自己的shell变量应该具有小写名称,就像在任何其他编程语言中一样。