使用python的子字符串multifasta文件

时间:2019-03-11 20:59:21

标签: python substring bioinformatics biopython fasta

我试图从multifasta文件中提取位置2到8(microRNA的种子)的序列。为此,我编写了一个小的python脚本。该脚本有效,但是我无法编写输出文件。谁能帮助我或为我指明正确的方向?

谢谢

脚本:

from Bio import SeqIO
for index, record in enumerate(SeqIO.parse("file.fasta","fasta")):
    seed= record.seq[1:8]
    a = (print(">" + record.id + '\n\ + seed)

输出:

>aga-miR-12417-5p
AGUCGUU
>aga-miR-12418-3p
GUUCGAU
>aga-miR-12419-5p
GCUGUUC

1 个答案:

答案 0 :(得分:0)

如果只需要写入一个简单的纯文本文件,则可以执行以下操作:

from Bio import SeqIO
with open('output_file', 'w') as output:
    for index, record in enumerate(SeqIO.parse("file.fasta","fasta")):
        seed= record.seq[1:8]
        output.writeline(">" + record.id)
        output.writeline(seed)