我想从一个更大的序列中随机寻找长度为4的子序列。
我尝试了以下代码:
import system
import random
X = 'ATGCATGCTAGCTAGTAAACGTACGTACGTACGATGCTAATATAGAGGGGCTTCGTACCCCTGA'
Y = [random.choice(X) for i in range(4)]
print(Y)
但它从X中选择了4个不同的元素,而不是连续的长度为4的序列。
答案 0 :(得分:1)
如果您想要一个长度为4的连续序列,而不是尝试使用X
从random.choice
中选择一个字符,请选择介于0和X
- 4之间的索引,并从该索引中获取4个元素。示例 -
>>> X = 'ATGCATGCTAGCTAGTAAACGTACGTACGTACGATGCTAATATAGAGGGGCTTCGTACCCCTGA'
>>> import random
>>> i = random.randint(0,len(X)-4)
>>> X[i:i+4]
'TGCA'
>>> i
1
答案 1 :(得分:1)
您可以随机选择一个起始索引,然后使用切片来提取该子字符串
def random_slice(s, n):
index = random.randint(0, len(s)-n)
return s[index : index + n]
>>> random_slice(X, 4)
'GCTA'
>>> random_slice(X, 4)
'CGTA'
>>> random_slice(X, 4)
'TATA'
>>> random_slice(X, 4)
'AGCT'