否则 - 如果空变量的Satement不起作用

时间:2018-05-12 19:07:31

标签: bash if-statement bioinformatics bcftools

我正在尝试在shell / bash脚本中编写一个if-else条件,该脚本将用于许多不同的文件,因此它不适合某个结构。

我有三个不同的文件,从这些文件中选择最多三个不同的变量进入if-else语句。在我的脚本中,我在开头编写了这个(可能以更好的方式编写),如下所示:

ANC1=$(sed -n 1p file1 | cut -f 1 -d' ' )
ANC2=$(sed -n 2p file1 | cut -f 1 -d' ' )
ANC3=$(sed -n 3p file1 | cut -f 1 -d' ' )

ANC11=$(sed -n 1p file2 | cut -f 1 -d' ' )
ANC21=$(sed -n 2p file2 | cut -f 1 -d' ' )
ANC31=$(sed -n 3p file2 | cut -f 1 -d' ' )

ANC15=$(sed -n 1p file3 | cut -f 1 -d' ' )
ANC25=$(sed -n 2p file3 | cut -f 1 -d' ' )
ANC35=$(sed -n 3p file3 | cut -f 1 -d' ' )

例如,从这些文件中可能会产生以下变量:

echo ${ANC1}
FIN
echo ${ANC2}
NFE
echo ${ANC3}


echo ${ANC11}
FIN
echo ${ANC21}
NFE
echo ${ANC31}


echo ${ANC15}
FIN
echo ${ANC25}
NFE
echo ${ANC35}
SAS 

从这里开始,我编写了if-else语句(考虑到上面三个文件中可能缺少的变量)。要理解它,尝试执行以下操作:

第一个条件:如果所有变量都不为空; 第二个条件:如果第三个变量是唯一缺失的变量; 第三个条件:如果第三个和第二个变量是空的

if [ "${ANC3}" != "" ] || [ "${ANC31}" != "" ] || [ "${ANC35}" != "" ]; then

    echo "***** three variables *****"

    bcftools merge -m both \
    fileref1.genotypes_${ANC1}.vcf.gz \
    fileref1.genotypes_${ANC2}.vcf.gz \
    fileref1.genotypes_${ANC3}.vcf.gz \
    -Oz \
    -o fileref1.new.genotypes_${ANC1}.${ANC2}.${ANC3}.vcf.gz

    bcftools merge -m both \
    fileref2.genotypes_${ANC11}.vcf.gz \
    fileref2.genotypes_${ANC21}.vcf.gz \
    fileref2.genotypes_${ANC31}.vcf.gz \
    -Oz \
    -o fileref2.new.genotypes_${ANC11}.${ANC21}.${ANC31}.vcf.gz

    bcftools merge -m both \
    fileref3.genotypes_${ANC15}.vcf.gz \
    fileref3.genotypes_${ANC25}.vcf.gz \
    fileref3.genotypes_${ANC35}.vcf.gz \
    -Oz \
    -o fileref1.new.genotypes_${ANC15}.${ANC25}.${ANC35}.vcf.gz

elif 
    [ "${ANC3}" == "" -a "${ANC2}" != "" ] || [ "${ANC31}" == "" -a "${ANC21}" != "" ] || [ "${ANC35}" == "" -a "${ANC25}" != "" ]; then

    echo "***** two variables *****"

    bcftools merge -m both \
    fileref1.genotypes_${ANC1}.vcf.gz \
    fileref1.genotypes_${ANC2}.vcf.gz \
    -Oz \
    -o fileref1.new.genotypes_${ANC1}.${ANC2}.vcf.gz

    bcftools merge -m both \
    fileref2.genotypes_${ANC11}.vcf.gz \
    fileref2.genotypes_${ANC21}.vcf.gz \
    -Oz \
    -o fileref2.new.genotypes_${ANC11}.${ANC21}.vcf.gz

    bcftools merge -m both \
    fileref3.genotypes_${ANC15}.vcf.gz \
    fileref3.genotypes_${ANC25}.vcf.gz \
    -Oz \
    -o fileref1.new.genotypes_${ANC15}.${ANC25}.vcf.gz

elif 
    [ "${ANC3}" == "" -a "${ANC2}" == "" ] || [ "${ANC31}" == "" -a "${ANC21}" == "" ] || [ "${ANC35}" == "" -a "${ANC25}" == "" ]; then 

    echo "***** one variable ***** "

    cp fileref1.genotypes_${ANC1}.vcf.gz fileref1.new.genotypes_${ANC1}.${ANC2}.vcf.gz

    cp fileref2.genotypes_${ANC11}.vcf.gz fileref2.new.genotypes_${ANC11}.vcf.gz

    cp fileref3.genotypes_${ANC15}.vcf.gz fileref1.new.genotypes_${ANC15}.vcf.gz

fi

每次运行此脚本时,都会产生3个文件,但有时情况并非如此。第一部分工作(对于所有变量都不为空的文件) - 但第二和第三个条件似乎没有。我还尝试[ -z "${ANC3}" ][ -n "${ANC2}" ]分别表示缺失和非缺失,但这也无效。同时尝试[[ ]]比较[ ],但仍然相同。

我显然遗失了什么?

2 个答案:

答案 0 :(得分:1)

我不确定我是否理解逻辑应该如何工作,但我认为你可能遇到De Morgan's laws的问题,这与逻辑否定如何与AND和OR结合有关。英语往往相当粗鄙,所以当你将你想要的东西翻译成代码逻辑时,你必须仔细考虑。具体来说,你说"第一个条件:如果所有变量都不是空的",而是相应的if语句:

if [ "${ANC3}" != "" ] || [ "${ANC31}" != "" ] || [ "${ANC35}" != "" ]; then

..实际上对应于"如果任何变量不为空"。

在您提供的示例中,ANC3ANC31都是空的(因此前两个测试返回为false),ANC35不为空(它是' s " SAS"),所以第三次测试是真的。 false || false || true计算结果为true,因此整个if条件为真,并且if语句的分支将被执行。是不是只有一个变量是非空的?

如果我对这个问题说得对,那么第一个if语句应该有&&而不是|| s,如下所示:

if [ "${ANC3}" != "" ] && [ "${ANC31}" != "" ] && [ "${ANC35}" != "" ]; then

elif测试也可能存在类似的问题,但正如我所说,我不确定我是否理解它应该做的正确。

答案 1 :(得分:1)

这不是一个完整的答案,但这里有简单的 POSIX shell示例,给定变量$x$y$z

  

第一个条件:如果所有变量都不为空;

[ "$x" -a "$y" -a "$z" ] && do_stuff
  

第二个条件:如果第三个变量是唯一缺失的变量;

[ "$x" -a "$y" -a ! "$z" ] && do_stuff
  

第三个条件:如果第三个和第二个变量为空

[ "$y$z" ] || do_stuff