我希望在python中创建一个正则表达式,匹配所有以T
开头,后跟18
个字符(任意字符)的DNA序列,然后以AA
,{{ {1}},TT
或CC
。我可以管理第一部分,但我似乎无法找到一种方法来编写结束(双字符)而不复制正则表达式4次。
这是我对以GG
结尾的序列所拥有的:
TT
答案 0 :(得分:5)
有一个名为交替的概念。它匹配给定选项中的任何一个:
r'T.{18}(?:TT|AA|CC|GG)'
请注意,您应该使用原始字符串在Python中对正则表达式进行编码,否则以后会出现转义字符的问题。