subprocess.call运行Mafft

时间:2018-12-11 18:38:54

标签: python command-line terminal subprocess bioinformatics

我编写了一个从终端运行mafft模块的脚本:

 import subprocess


def linsi_MSA(sequnces_file_path):
    cmd = ' mafft --maxiterate 1000 --localpair {seqs} > {out}'.format(seqs=sequnces_file_path, out=sequnces_file_path)
    subprocess.call(cmd.split(), shell=True)

if __name__ == '__main__':
    import logging
    logger = logging.getLogger('main')
    from sys import argv
    if len(argv) < 2:
        logger.error('Usage: MSA <sequnces_file_path> ')
        exit()
    else:
        linsi_MSA(*argv[1:])

出于某些原因,尝试使用以下命令从终端运行脚本:

python ./MSA.py ./sample.fa

我直接在终端打开了mafft交互式版本(要求输入..output等。)

当我尝试使用以下命令直接在终端中编写cmd时:

mafft --maxiterate 1000 --localpair sample.fa > sample.fa 

它可以正常工作,并且在不打开交互式版本的情况下也可以执行命令行版本。

我希望我的脚本能够在终端上执行cmd行版本。似乎是什么问题?

谢谢!

1 个答案:

答案 0 :(得分:0)

如果使用shell=True,则应传递一个字符串作为参数,而不是列表,例如:

subprocess.call("ls > outfile", shell=True)

文档中没有对此进行解释,但是我怀疑这与最终称为底层库函数有关:

call(["ls", "-l"]) --> execlp("ls", "-l")

      ^^^^^^^^^^              ^^^^^^^^^^
call("ls -l", shell=True) --> execlp("sh", "-c", "ls -l")
     ^^^^^^^                                     ^^^^^^^ 

call(["ls", "-l"], shell=True) --> execlp("sh", "-c", "ls", "-l")

# which can be tried from command line:
sh -c ls -l
# result is a list of files without details, -l was ignored.
# see sh(1) man page for -c string syntax and what happens to further arguments.