如何在庞大的序列列表中找到某些序列

时间:2013-03-18 07:59:16

标签: python

P0C5Z8: MLGVINRMAKKFNYKLPSMVALTLVGSAVTAHQVQAAETTQDQTTNKNVLDSNKVKATTEQAKAEVKNPTQNISGTQVYQDPAIVQPKTANNKTGNAQVS
Q53630: MSNNFKDDFEKNRQSIDTNSHQDHTEDVEKDQSELEHQDTIENTEQQFPPRNAQRRKRRRDLATNHNKQVHNESQTSEDNVQNEAGTIDDRQVESSHSTE
P0C6P1: MKKKLLVLTMSTLFATQLINSNHANASVTESVDKKFVVPESGINKIIPTYNEFKKAPKVNVSNLTDNKNFVASEDKLKKISDPSAASKIVDKNFVVPESK
O69174: MPIITDVYAREVLDSRGNPTVEVEVLTESGAFGRALVPSGASTGEHEAVELRDGDKSRYLGKGVTKAVENVNEIIAPEIIEGEFSVLDQVSIDKMMIALD
P0A031: MLEFEQGFNHLATLKVIGVGGGGNNAVNRMIDHGMNNVEFIAINTDGQALNLSKAESKIQIGEKLTRGLGAGANPEIGKKAAEESREQIEDAIQGADMVF
P0C1S5: MTKHYLNSKYQSEQRSSAMKKITMGTASIILGSLVYIGADSQQVNAATEATNATNNQSTQVSQATSQPINFQVQKDGSSEKSHMDDYMQHPGKVIKQNNK
P0C1S0: MSDQHNLKEQLCFSLYNAQRQVNRYYSNKVFKKYNLTYPQFLVLTILWDESPVNVKKVVTELALDTGTVSPLLKRMEQVDLIKRERSEVDQREVFIHLTD

我有这个序列列表....但是我想知道这个序列(TGTCV)是否在整个列表中是明显的 我如何用代码查找它?

2 个答案:

答案 0 :(得分:3)

lol = """P0C5Z8: MLGVINRMAKKFNYKLPSMVALTLVGSAVTAHQVQAAETTQDQTTNKNVLDSNKVKATTEQAKAEVKNPTQNISGTQVYQDPAIVQPKTANNKTGNAQVS
Q53630: MSNNFKDDFEKNRQSIDTNSHQDHTEDVEKDQSELEHQDTIENTEQQFPPRNAQRRKRRRDLATNHNKQVHNESQTSEDNVQNEAGTIDDRQVESSHSTE
P0C6P1: MKKKLLVLTMSTLFATQLINSNHANASVTESVDKKFVVPESGINKIIPTYNEFKKAPKVNVSNLTDNKNFVASEDKLKKISDPSAASKIVDKNFVVPESK
O69174: MPIITDVYAREVLDSRGNPTVEVEVLTESGAFGRALVPSGASTGEHEAVELRDGDKSRYLGKGVTKAVENVNEIIAPEIIEGEFSVLDQVSIDKMMIALD
P0A031: MLEFEQGFNHLATLKVIGVGGGGNNAVNRMIDHGMNNVEFIAINTDGQALNLSKAESKIQIGEKLTRGLGAGANPEIGKKAAEESREQIEDAIQGADMVF
P0C1S5: MTKHYLNSKYQSEQRSSAMKKITMGTASIILGSLVYIGADSQQVNAATEATNATNNQSTQVSQATSQPINFQVQKDGSSEKSHMDDYMQHPGKVIKQNNK
P0C1S0: MSDQHNLKEQLCFSLYNAQRQVNRYYSNKVFKKYNLTYPQFLVLTILWDESPVNVKKVVTELALDTGTVSPLLKRMEQVDLIKRERSEVDQREVFIHLTD"""

print "TGTCV" in lol

答案 1 :(得分:1)

只需使用string.count

>>> string.count('TGTCV')
0

或尝试使用正则表达式

>>> regex = re.compile("TGTCV")
>>> r = regex.search(string)
# Run findall
>>> print len(regex.findall(string)) # count of 'TGTCV'
0