我有两个fasta文件。 每个文件包含大鼠或小鼠中具有物种特异性已知SNP的短基因组区域的序列。
File_1 :
>Rat_1
GGTGCCTGTGTATTGCCTCTGTCGACTGCCTTACGATGTGACCCGCTTCATGAT
>Rat_2
AAGCGGCCGGTTTCCTTGGCGACGAAGAGCGCGGGAATTTCAGATAGATTGTAATTGCGGCTGC
>Rat_3
GCAGCCATCTCTGCAACAATTGTGACAATGGCTGAGCCTAGCACAGACCCCAACAAAGAT
File_2 :
>Mouse_1
GGTGCCTGTGTATTACCTCTGTCGACTGCCTTACGATGTGACCCGCTTCATGAT
>Mouse_1_2
AAGCGGCCGGTTTCCTTGGCGTCGAAGAGCGCGGGAATTTCAGATAGATTGTAATTGCGGCTGC
>Mouse_1_3
GCAGCCATCTCTGCAACAATTGTGACAATGGTTGAGCCTAGCACAGACCCCAACAAAGAT
我想要做的是找到SNP并提取约20个碱基。 结果应该如下所示......
Resut_file :
>Rat_1
CTGTGTATTGCCTCTGTC
^
>Mouse_1
CTGTGTATTACCTCTGTC
^
拜托我,编程大师!!!
谢谢。