我对python一无所知,并且我试图将来自各种线程的信息拼凑起来完成一项任务,但我仍然无法破解它。
这是作业:
说明
a)下载RAI1 mRNA NM_030665
的序列,并使用Python计算ATG子序列的数量,使用:
countATG = seq.count('ATG').
例如,对于SREBF1 NM_001005291.2
,答案为45
。
我不是在寻找问题的答案。我真的想要了解更多有关python的信息,如果有人能告诉我如何完成这个问题,我真的很感激。我将序列保存到我的桌面作为.txt文件,但我不知道如何指定seq1应该等于数据文件(如果这是有意义的)。是的,我可以在NCBI上按Ctrl + F顺序,但我想学习如何使用python。
谢谢!!
答案 0 :(得分:0)
你走了:
filepath = '/path/to/file.txt'
with open(filepath) as infile:
seq = infile.readlines()
# This will bring in the sequence, but if its split up on multiple lines
# (like if its cut off at every 50 bp), then you'll want to piece it back
# together, so you don't miss any ATG's.
seq = ''.join([line.strip() for line in seq.split()])
ATG_count = seq.count('ATG')
print(ATG_count)