我有一个程序,用于通过itertools创建一个sequencea的fasta文件。
import itertools
input=['ARIMALTHNAEYSDSFTAL','ARIMFLTHNFEYSESFTAL','AHIMNPTENAEYHESFTAL','AHIMNPTENTEYWDSFTAL','AHIMNDTHNFEYHDSFTAL','AHIMNDTNNTEYWESFTAL','ARIMFDTENAEYHDSFTAL','AHIMADTNNTEYWDSFTAL','ARIMFLTENTEYHESFTAL']
l=len(input[0])
my_residues=[set() for _ in xrange(l)]
for h in input:
for i,x in enumerate(h):
my_residues[i].add(x)
my_residues=[list(x) for x in my_residues]
fo=open('autotest.fasta','w')
vals=[]
for x in itertools.product(*my_residues):
val = ''.join(x)
vals.append('>'+'\n'+val)
print val
with open('autotest.fasta','w') as fo:
fo.write('\n'.join(vals))
fo.close()
这个程序运行正常。这将给出名为autotest.fasta的输出文件,看起来像
>
AHIMAPTHNAEYHESFTAL
>
AHIMAPTHNAEYHDSFTAL
>
AHIMAPTHNAEYSESFTAL
>
AHIMAPTHNAEYSDSFTAL
>
AHIMAPTHNAEYWESFTAL
>
AHIMAPTHNAEYWDSFTAL
...
这里我想要的是命名序列,以便输出autotest.fasta看起来像
>00
AHIMAPTHNAEYHESFTAL
>01
AHIMAPTHNAEYHDSFTAL
>02
AHIMAPTHNAEYSESFTAL
>03
AHIMAPTHNAEYSDSFTAL
>04
AHIMAPTHNAEYWESFTAL
>05
AHIMAPTHNAEYWDSFTAL
...
这样它就可以应用于任何输入。
任何帮助将不胜感激。谢谢。
答案 0 :(得分:2)
vals=[]
counter=0
for x in itertools.product(*my_residues):
val = ''.join(x)
vals.append('>%02d\n%s' % (counter, val))
print val
counter += 1