将主题按参考序列映射回多个位置

时间:2018-08-14 12:04:17

标签: python r alignment bioinformatics

我正在尝试将数百个转录因子结合位点序列与我的参考序列进行比对。

例如,在下面的序列中,粗体显示了它映射到的两个TF结合位点。

CTGGCGCGTGATCAACTGGCCAATCATGGCATCTGTCATTGTGAGTATAACCTCACACCCGTACTTCTAAACACACACAGACCAGCCTCATACTGTATGCATT ATGTCAG GCAGG GAGGGATTCTGCCAGCAAAGCAGACGAGGGGATGTGCTGAGTCTCACAGACACTTTCCTGGATAAGACATGAATGCAGGC ATGTCAG GAAGAGCAAGCAAACACGCTGTCC

当我尝试在snapgene中使用比对功能时,输出显示TF序列映射到的一个位点。但是,当我手动ctrl + f搜索我的TF序列的匹配项时,有两个位点(上面的粗体)与我的序列100%匹配,但是对于第一个匹配项,它只能由snapgene自动对齐或制成特征网站,它不会在第二个网站上使用。我只是想知道是否有任何建议或平台(例如python,R)将多个短序列映射到参考序列,该序列或功能能够注释参考序列上所有可能的比对位点?

1 个答案:

答案 0 :(得分:2)

在这种情况下,生物导体Biostrings vmatchPDict()可能效果很好;有关示例,请参见帮助页面?vmatchPDict