我在这里有多段代码,并且在将它们组合在一起时会出现问题,因此我的函数实际上会运行。
我有一个功能:
def getGenes(spliced, infile, outfile):
具有可选的第一个参数'-s',当用户输入时表示'switch'调用'剪接的基因序列'。因此,我跟着它(另外,当运行时.sys.agrv [1] = spliced sys.argv [2] = infile和sys.argv [3] = outfile):
import sys
spliced = False
if '-s' in sys.argv:
spliced = True
infile, outfile = sys.argv[2:]
现在,无论文件是否包含我想从infile到outfile写入以下内容的开关:
fp = open(infile, 'r')
for line in fp:
line = line.replace(',',' ')
tokens = line.split()
if '-s' in sys.argv and r:
wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4])+'|'+int(tokens[5])+'-'+int(tokens[10])+','+int(tokens[8])+'-'+int(tokens[11]))
else:
wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4]))
第一个语句应该在给出拼接参数时写入,第二个(else部分)应该在没有给出拼接参数时写入)。上面的代码创建了序列的信息行,该序列将在outfile的下一行。
在此之后,根据文件中的行是否在特定位置包含“+”或“ - ”,将访问另一个文件以在某些坐标处拉出字符串。取出的这部分应直接写在上面的相应行下面。所以,对于拼接和未拼接的参数,我应该有一个'+'和' - '部分。我有以下代码:
fp2 = open('chr22.fa', 'r')
for line in fp2:
newstring = ''
z = line.strip()
newstring += z
for line in fp:
fields = line.split('\t')
gene_ID, chr, strand = fields[:2]
start = int(fields[3])
end = int(fields[4])
bc = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A', 'N':'N'}
if strand == '+':
wp.write(newstring[start:end])
if strand == '-':
newstart, newend = -(start + 1), -(end + 1)
wp.write(bc[base.upper()] for base in newstring[newstart:newend])
正如您所看到的,我根据是否存在“+”或“ - ”来从文件中选择不同的部分。也就是说,我需要将它用于拼接和未拼接选项。但是从这个文件中提取的每一行(或字符串)都应该放置其相应的信息行(在最后一段代码中创建)。这里的代码是从另一个文件中提取序列并进行翻译。
我需要以某种方式将这两段代码放在一起,因此我的outfile格式为:
信息
相应的序列
另一个信息行
相应的序列
答案 0 :(得分:1)
你不能做一个,然后另一个,就像这样:
for line in fp:
# Info line
line = line.replace(',',' ')
tokens = line.split()
if '-s' in sys.argv and r:
wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4])+'|'+int(tokens[5])+'-'+int(tokens[10])+','+int(tokens[8])+'-'+int(tokens[11]))
else:
wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4]))
# Sequence line
fields = line.split('\t')
gene_ID, chr, strand = fields[:2]
start = int(fields[3])
end = int(fields[4])
bc = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A', 'N':'N'}
if strand == '+':
wp.write(newstring[start:end])
if strand == '-':
newstart, newend = -(start + 1), -(end + 1)
wp.write(bc[base.upper()] for base in newstring[newstart:newend])
或者我在这里遗漏了什么?