Bash脚本循环只运行一次

时间:2017-03-01 14:08:40

标签: bash loops bioinformatics

我正在尝试解析输入文件(我的测试文件是4行),然后查询在线生物数据库。然而,在返回第一个结果后,我的循环似乎停止了。

#!/bin/bash
if [ "$1" = "" ]; then
        echo "No input file to parse given. Give me a BLAST output file"
else
        file=$1
        #Extracts GI from each result and stores it on temp file.
        rm -rf /home/chris/TEMP/tempfile.txt
        awk -F '|' '{printf("%s\n",$2);}' "$file" >> /home/chris/TEMP/tempfile.txt
        #gets the species from each gi.
        input="/home/chris/TEMP/tempfile.txt"
        while read -r i
        do
                echo GI:"$i"
                /home/chris/EntrezDirect/edirect/esearch -db protein -query "$i" | /home/chris/EntrezDirect/edirect/efetch -format gpc | /home/chris/EntrezDirect/edirect/xtract -insd source o
rganism | cut -f2 
        done < "$input"
        rm -rf /home/chris/TEMP/tempfile.txt
fi

例如,我唯一的输出是

GI:751637161

Pseudomonas stutzeri group

而我应该有4个结果。任何帮助表示赞赏和感谢。

这是样本输入的格式:

TARA042SRF022_1 gi|751637161|ref|WP_041104882.1|    40.4    151 82  2   999 547 1   143 2.8e-21 110.9
TARA042SRF022_2 gi|1057355277|ref|WP_068715547.1|   62.7    263 96  1   915 133 80  342 7.1e-96 358.6
TARA042SRF022_3 gi|950462516|ref|WP_057369049.1|    38.3    47  29  0   184 44  152 198 5.1e+01 36.2
TARA042SRF022_4 gi|918428433|ref|WP_052479609.1|    37.5    48  29  1   525 668 192 238 6.1e+01 37.0

2 个答案:

答案 0 :(得分:5)

似乎read -r i在第二次调用时返回非零退出状态,表示没有更多数据要从输入文件中读取。这通常意味着while循环内的命令从标准输入读取,并在read有机会之前消耗文件的其余部分。

此处唯一的候选者是esearch,因为echo不从标准输入读取,而其他命令都是从管道中的上一个命令读取的。重定向esearch的标准输入,以便它不会无意中消耗您的输入数据。

while read -r i
do
    echo GI:"$i"
    /home/chris/EntrezDirect/edirect/esearch -db protein -query "$i" < /dev/null |
      /home/chris/EntrezDirect/edirect/efetch -format gpc |
      /home/chris/EntrezDirect/edirect/xtract -insd source organism |
      cut -f2 
done < "$input"

答案 1 :(得分:0)

使用cut从ASCII文件中提取列,使用-d选项表示分隔符,使用-f指定列。将所有内容包裹在循环中

$ cat data.txt
TARA042SRF022_1 gi|751637161|ref|WP_041104882.1|    40.4    151 82  2   999 547 1   143 2.8e-21 110.9
TARA042SRF022_2 gi|1057355277|ref|WP_068715547.1|   62.7    263 96  1   915 133 80  342 7.1e-96 358.6
TARA042SRF022_3 gi|950462516|ref|WP_057369049.1|    38.3    47  29  0   184 44  152 198 5.1e+01 36.2
TARA042SRF022_4 gi|918428433|ref|WP_052479609.1|    37.5    48  29  1   525 668 192 238 6.1e+01 37.0

$ cat t.sh
#!/bin/bash

for gi in $(cut -d"|" -f 2 data.txt); do
    echo $gi
done

$ bash t.sh
751637161
1057355277
950462516
918428433

编辑: 我无法重现问题,但我觉得它与换行符和/或临时文件的使用有关。我的建议省略了这个,但没有回答你的实际问题(但我猜你的问题)