正则表达式-通过特定模板查找字母

时间:2019-05-30 21:26:24

标签: nsregularexpression

我需要编写有关DNA的代码。

我需要在多义字母的str之间找到需要与模板匹配的6个字母的顺序。

例如:在索引0中,它可以是字母A或T,也就是只有那些字母。我该怎么做?正则表达式中的哪种函数?

the_str = "AAATAAAATAAATAATAAAGAGCCAGAGGCCCTTGAAGAATGGATGGAAT\
TTGGACTTTAGCGGGGCTGGGGGACCCCGGAAATGGACGAGAAGCAGAAC\
CGAGGCCCTTTAGGGCTCAGCGGAGGCCTGCCTGTCTCTCTAAGGTCCCT\
CTTGGAGCAACTGAAGAAACTCCAGGCCATTGTGGTGCAGTCCACCAGCA\
AGTCAGCCCAGACAGGCACCTGTGTCGCAGTGAGTCCTGGTGCCCCCAGG\
CAAGCCGGGGACCTAGGCTTCTGTAGAGGGGCCCATAGGGAGGTGACAAT\
GAGTCCAAGCTCTCCTTGTGCCCCAGCTCAAGTATGATCCAGTCTGGTCT\
TTGGGGCCTCAGTTTCCCTGCCTGTGGGATGGAGATGCTTGCAGGGGAGG\
GGAGGGAGGGGGTGACTCTGCCGCTGTCTCCACCAGGTCCTGTTGCTGTC"

1 个答案:

答案 0 :(得分:0)

听起来您可能需要这样的东西吗?

(A | T)AGCGG

与AAGCGG或TAGCGG匹配。

如果第四个字符可以是C,A,G中的任何一个,则它可能看起来像这样:

(A | T)AG(C | A | G)GG