我需要编写有关DNA的代码。
我需要在多义字母的str之间找到需要与模板匹配的6个字母的顺序。
例如:在索引0中,它可以是字母A或T,也就是只有那些字母。我该怎么做?正则表达式中的哪种函数?
the_str = "AAATAAAATAAATAATAAAGAGCCAGAGGCCCTTGAAGAATGGATGGAAT\
TTGGACTTTAGCGGGGCTGGGGGACCCCGGAAATGGACGAGAAGCAGAAC\
CGAGGCCCTTTAGGGCTCAGCGGAGGCCTGCCTGTCTCTCTAAGGTCCCT\
CTTGGAGCAACTGAAGAAACTCCAGGCCATTGTGGTGCAGTCCACCAGCA\
AGTCAGCCCAGACAGGCACCTGTGTCGCAGTGAGTCCTGGTGCCCCCAGG\
CAAGCCGGGGACCTAGGCTTCTGTAGAGGGGCCCATAGGGAGGTGACAAT\
GAGTCCAAGCTCTCCTTGTGCCCCAGCTCAAGTATGATCCAGTCTGGTCT\
TTGGGGCCTCAGTTTCCCTGCCTGTGGGATGGAGATGCTTGCAGGGGAGG\
GGAGGGAGGGGGTGACTCTGCCGCTGTCTCCACCAGGTCCTGTTGCTGTC"
答案 0 :(得分:0)
听起来您可能需要这样的东西吗?
(A | T)AGCGG
与AAGCGG或TAGCGG匹配。
如果第四个字符可以是C,A,G中的任何一个,则它可能看起来像这样:
(A | T)AG(C | A | G)GG