这是我写的脚本。
两个问题。
首先,我们需要打印形成XML hit_id,hit_len和hit_def的blast结果。前两个很容易。但是hit.def与def相同。如何避免呢?
其次,我们需要在linux上运行该程序。该程序应该接受两个序列,一个是蛋白质,一个是核酸,使用可选参数。但我无法实现这个功能。
时应该有效
$ python my_program.py protein.fa tem.txt prot
最后一个是参数选项。我不知道为什么python在我写作时不接受它
f=sys.argv[3]
f1=str(sys.argv[3])
if f1 is 'prot':
function(filename,protflag=True)
Python总是选择'否则'
# IMPORT
import sys
import subprocess
################################################################################
# FUNCTIONS
#execute BLAST, vailable type are protein and nuclien
def run_blast(filename,protflag=True):
"""execute BLAST, vailable type are prot or na"""
if protflag:
subprocess.call(['blastp','-query','filename','-db','nr','-outfmt','5','-out','prot.xml'])
else :
subprocess.call(['blastn','-query','filename','-db','nt','-outfmt','5','-out','na.xml'])
def read_XML(filename):
"""return hit_id length hit_def"""
from Bio.Blast import NCBIXML
name=str(filename)
record=NCBIXML.read(open(name))
for i in range(0,len(record.alignments)):
hit=record.alignments[i]
print 'hit_id'+hit.id+'\n'+'length'+hit.len+'\n'+'hit_def'+hit.def+'\n'#here is the problem .def
################################################################################
# MAIN
# write a function for the "main method"
def main(filename=sys.argv[1],protflag=True):
"""excuate BLAST with file then return the hit_id, length and hit_def"""
f=sys.argv[3]
f1=str(f)
if f is 'prot':
run_blast(filename,True)
read_XML("prot.xml")
elif f is 'na':
run_blast(filename,False)
read_XML("prot.xml")
else:
print 'only prot and na available'
if __name__ == '__main__':
# defaults to reading the system, see above :)
main()
答案 0 :(得分:0)
" else"总是选择子句,因为你正在使用"是"而不是" =="检查sys.argv [3]的值。
来自Is there a difference between `==` and `is` in Python?:
如果两个变量指向同一个对象,将返回True,如果变量引用的对象相等,则返回=。
你应该使用
if f1 == 'prot':