使用Python在mRNA序列中找到ATG

时间:2017-09-28 12:01:31

标签: python

我对python一无所知,并且我试图将来自各种线程的信息拼凑起来完成一项任务,但我仍然无法破解它。

这是作业:

说明 a)下载RAI1 mRNA NM_030665的序列,并使用Python计算ATG子序列的数量,使用:

countATG = seq.count('ATG'). 

例如,对于SREBF1 NM_001005291.2,答案为45

我不是在寻找问题的答案。我真的想要了解更多有关python的信息,如果有人能告诉我如何完成这个问题,我真的很感激。我将序列保存到我的桌面作为.txt文件,但我不知道如何指定seq1应该等于数据文件(如果这是有意义的)。是的,我可以在NCBI上按Ctrl + F顺序,但我想学习如何使用python。

谢谢!!

1 个答案:

答案 0 :(得分:0)

你走了:

filepath = '/path/to/file.txt'

with open(filepath) as infile:
    seq = infile.readlines()

# This will bring in the sequence, but if its split up on multiple lines
# (like if its cut off at every 50 bp), then you'll want to piece it back
# together, so you don't miss any ATG's.

seq = ''.join([line.strip() for line in seq.split()])

ATG_count = seq.count('ATG')

print(ATG_count)