表示DNA代码的String的正则表达式

时间:2011-05-16 15:06:12

标签: regex

您好 我试图在java程序中使用正则表达式。我希望正则表达式识别一个长度未知的字符串,其字符串只有'C','A','G'或'T'。 谢谢你的帮助。

3 个答案:

答案 0 :(得分:6)

简单,只需使用字符类:

[CAGT]+

或者,如果整个字符串必须包含字符CAGT以便匹配:

^[CAGT]+$

答案 1 :(得分:2)

添加到上面:

^[CAGTcagt]+$

确保检测小写和大写字符。

答案 2 :(得分:2)

我不同意最投票的答案。使用[ACGT]+时,大字符串将导致大量内存使用。所以我会使用一个否定的正则表达式,并检查字符串是否不包含非[ACGT]字符:

str !~ [^ACGTacgt]