将两段代码放在一起使其正常工作

时间:2012-04-26 13:22:11

标签: python command-line

我在这里有多段代码,并且在将它们组合在一起时会出现问题,因此我的函数实际上会运行。

我有一个功能:

def getGenes(spliced, infile, outfile):

具有可选的第一个参数'-s',当用户输入时表示'switch'调用'剪接的基因序列'。因此,我跟着它(另外,当运行时.sys.agrv [1] = spliced sys.argv [2] = infile和sys.argv [3] = outfile):

import sys
spliced = False
if '-s' in sys.argv:
    spliced = True
    infile, outfile = sys.argv[2:]

现在,无论文件是否包含我想从infile到outfile写入以下内容的开关:

fp = open(infile, 'r')
for line in fp:
    line = line.replace(',',' ')
    tokens = line.split()
    if '-s' in sys.argv and r:
        wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4])+'|'+int(tokens[5])+'-'+int(tokens[10])+','+int(tokens[8])+'-'+int(tokens[11]))
    else:
        wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4]))

第一个语句应该在给出拼接参数时写入,第二个(else部分)应该在没有给出拼接参数时写入)。上面的代码创建了序列的信息行,该序列将在outfile的下一行。

在此之后,根据文件中的行是否在特定位置包含“+”或“ - ”,将访问另一个文件以在某些坐标处拉出字符串。取出的这部分应直接写在上面的相应行下面。所以,对于拼接和未拼接的参数,我应该有一个'+'和' - '部分。我有以下代码:

fp2 = open('chr22.fa', 'r')
for line in fp2:
    newstring = ''
    z = line.strip()
    newstring += z
for line in fp:
    fields = line.split('\t')
    gene_ID, chr, strand = fields[:2]
    start = int(fields[3])
    end = int(fields[4])
    bc = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A', 'N':'N'}       
    if strand == '+':
        wp.write(newstring[start:end]) 
    if strand == '-':
        newstart, newend = -(start + 1), -(end + 1)
        wp.write(bc[base.upper()] for base in newstring[newstart:newend]) 

正如您所看到的,我根据是否存在“+”或“ - ”来从文件中选择不同的部分。也就是说,我需要将它用于拼接和未拼接选项。但是从这个文件中提取的每一行(或字符串)都应该放置其相应的信息行(在最后一段代码中创建)。这里的代码是从另一个文件中提取序列并进行翻译。

我需要以某种方式将这两段代码放在一起,因此我的outfile格式为:

信息

相应的序列

另一个信息行

相应的序列

1 个答案:

答案 0 :(得分:1)

你不能做一个,然后另一个,就像这样:

for line in fp:
  # Info line
  line = line.replace(',',' ')
  tokens = line.split()
  if '-s' in sys.argv and r:
    wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4])+'|'+int(tokens[5])+'-'+int(tokens[10])+','+int(tokens[8])+'-'+int(tokens[11]))
  else:
    wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4]))

  # Sequence line
  fields = line.split('\t')
  gene_ID, chr, strand = fields[:2]
  start = int(fields[3])
  end = int(fields[4])
  bc = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A', 'N':'N'}       
  if strand == '+':
    wp.write(newstring[start:end]) 
  if strand == '-':
    newstart, newend = -(start + 1), -(end + 1)
    wp.write(bc[base.upper()] for base in newstring[newstart:newend])

或者我在这里遗漏了什么?