在python中以较大的序列随机搜索特定长度的小序列

时间:2015-09-29 18:41:13

标签: python random choice

我想从一个更大的序列中随机寻找长度为4的子序列。

我尝试了以下代码:

import system
import random

    X = 'ATGCATGCTAGCTAGTAAACGTACGTACGTACGATGCTAATATAGAGGGGCTTCGTACCCCTGA'
    Y = [random.choice(X) for i in range(4)]
    print(Y)

但它从X中选择了4个不同的元素,而不是连续的长度为4的序列。

2 个答案:

答案 0 :(得分:1)

如果您想要一个长度为4的连续序列,而不是尝试使用Xrandom.choice中选择一个字符,请选择介于0和X - 4之间的索引,并从该索引中获取4个元素。示例 -

>>> X = 'ATGCATGCTAGCTAGTAAACGTACGTACGTACGATGCTAATATAGAGGGGCTTCGTACCCCTGA'
>>> import random
>>> i = random.randint(0,len(X)-4)
>>> X[i:i+4]
'TGCA'
>>> i
1

答案 1 :(得分:1)

您可以随机选择一个起始索引,然后使用切片来提取该子字符串

def random_slice(s, n):
    index = random.randint(0, len(s)-n)
    return s[index : index + n]

>>> random_slice(X, 4)
'GCTA'
>>> random_slice(X, 4)
'CGTA'
>>> random_slice(X, 4)
'TATA'
>>> random_slice(X, 4)
'AGCT'