蛋白质编码基因正则表达

时间:2017-08-25 14:10:00

标签: regex parsing compilation nsregularexpression

我正在尝试编写一个符合以下说明的正则表达式 带有“AT”前缀的字符序列,后跟“nG”,其中n是1到5之间的数字,然后是“G”,最后是5个数字后缀。

注意:只是普通的正则表达式而不是语言特定的。

匹配字符串的示例是:“AT1G01040”

以下是我可以构建AT[1-5]G(d\{1,5})的内容,但我不确定这是否是正确答案。

拜托,我需要你的帮助。

1 个答案:

答案 0 :(得分:3)

如果最后的位数可以是1到5,您可以使用

1,

请参阅regex demo

请注意,如果末尾的位数必须精确为5,则必须删除^AT[1-5]G[0-9]{5}$

^

<强>详情

  • AT - 字符串开头
  • AT - 一系列字符[1-5]
  • 1 - 2345G
  • G - [0-9]{1,5}字符
  • {5} - 连续1至5次出现的ASCII数字(或 - 如果您使用$ - 恰好5次出现)
  • next.handle(req).do - 字符串结束。