我正在尝试构建一个与2个字符的重复DNA序列匹配的正则表达式。这些字符可以是相同的。
正则表达式应该匹配2个字符的重复序列至少3次,这里有一些例子:
正则表达式应匹配:
并且不应匹配:
到目前为止,我已经提出了以下正则表达式:
[ACGT]{2}
它捕获由恰好两个字符(A,C,G或T)组成的任何序列。现在我想重复这个模式至少三次,所以我尝试了以下正则表达式:
[ACGT]{2}{3,}
([ACGT]{2}){3,}
不幸的是,第一个引发了'多次重复'错误(Python),而第二个错误只会匹配包含A,C,G和T的6个字符的任何序列。
有没有人可以帮我解决这个正则表达式? 提前谢谢。
答案 0 :(得分:7)
答案 1 :(得分:0)
一:
(AT){3}
两个
(GA){4}
三
C{6}
将它们结合起来!
(C{6}|(GA){4}|(AT){3})