我尝试按列表中给出的位置拆分字符串,然后将这些部分添加到新列表中。我从:
开始seq = 'ATCGATCGATCG'
seq_new = []
seq_cut = [2, 8 , 10]
我想得到:
seq_new = ['AT', 'CGATCG', 'AT', 'CG']
位置列表的大小和值可变。我该如何处理这样的数据?
答案 0 :(得分:7)
seq_new = [seq[start:end] for start, end in zip([None] + seq_cut, seq_cut + [None])]
将[None, 2, 8 , 10]
和[2, 8, 10, None]
压缩在一起以创建索引[(None, 2), (2, 8), (8, 10), (10, None)]
。 None
作为第一个索引默认为零,None
,因为第二个索引默认为要切片的序列的大小。
答案 1 :(得分:5)
使用切片:
seq = "ATCGATCGATCG"
seq_new = []
seq_cut = [2, 8, 10]
last = 0
for idx in seq_cut:
seq_new.append(seq[last:idx])
last = idx
seq_new.append(seq[last:])