从SRE_Match对象获取跨度和匹配值(Python)

时间:2018-06-30 10:46:54

标签: python regex object bioinformatics dna-sequence

我正在尝试在DNA序列中找到一定长度的匹配项(范围4到12)

下面是代码:

import re
positions =[]
for i in range(4,12):
    for j in range(len(dna)- i+1):
        positions.append(re.search(dna[j:j+i],comp_dna))

#Remove the 'None' from the search
position_hits = [x for x in positions if x is not None]

我明白了:

[<_sre.SRE_Match object; span=(0, 4), match='ATGC'>,.........]

如何从跨度和匹配中提取值? 我已经尝试过.group(),但是抛出了错误

AttributeError: 'list' object has no attribute 'group'

1 个答案:

答案 0 :(得分:1)

如果要解决当前问题,可以使用

position_hits = [x.group() for x in positions if x]

您可以直接在for循环中获得所有匹配项:

import re
position_hits = []
for i in range(4,12):
    for j in range(len(dna)-i+1):
        m = re.search(dna[j:j+i],comp_dna)
        position_hits.append(m.group())