命名序列

时间:2013-03-20 05:49:29

标签: python naming

我有一个程序,用于通过itertools创建一个sequencea的fasta文件。

import itertools
input=['ARIMALTHNAEYSDSFTAL','ARIMFLTHNFEYSESFTAL','AHIMNPTENAEYHESFTAL','AHIMNPTENTEYWDSFTAL','AHIMNDTHNFEYHDSFTAL','AHIMNDTNNTEYWESFTAL','ARIMFDTENAEYHDSFTAL','AHIMADTNNTEYWDSFTAL','ARIMFLTENTEYHESFTAL']

l=len(input[0])

my_residues=[set() for _ in xrange(l)]
for h in input: 
    for i,x in enumerate(h): 
        my_residues[i].add(x)

my_residues=[list(x) for x in my_residues]
fo=open('autotest.fasta','w')
vals=[]
for x in itertools.product(*my_residues): 
    val = ''.join(x)
    vals.append('>'+'\n'+val)
    print val

with open('autotest.fasta','w') as fo:
    fo.write('\n'.join(vals))
fo.close()

这个程序运行正常。这将给出名为autotest.fasta的输出文件,看起来像

>
AHIMAPTHNAEYHESFTAL
>
AHIMAPTHNAEYHDSFTAL
>
AHIMAPTHNAEYSESFTAL
>
AHIMAPTHNAEYSDSFTAL
>
AHIMAPTHNAEYWESFTAL
>
AHIMAPTHNAEYWDSFTAL
...

这里我想要的是命名序列,以便输出autotest.fasta看起来像

>00
AHIMAPTHNAEYHESFTAL
>01
AHIMAPTHNAEYHDSFTAL
>02
AHIMAPTHNAEYSESFTAL
>03
AHIMAPTHNAEYSDSFTAL
>04
AHIMAPTHNAEYWESFTAL
>05
AHIMAPTHNAEYWDSFTAL
...

这样它就可以应用于任何输入。

任何帮助将不胜感激。谢谢。

1 个答案:

答案 0 :(得分:2)

vals=[]
counter=0
for x in itertools.product(*my_residues): 
    val = ''.join(x)
    vals.append('>%02d\n%s' % (counter, val))
    print val
    counter += 1