我是生物信息学领域的新手。我正在看一个BLAST xml输出文件,我试图理解为什么每次爆炸都会有多个HSP。我知道HSP代表高分段对,但我并不真正理解多个HSP如何以及为什么被分配给单个命中。
答案 0 :(得分:0)
Okk,所以我给你一个大致的想法。例如,对于序列A和序列B,序列的多个部分可以是相同/相似或高分。更具体一点:
序列A:####### AAAAAA ATCG /////////////////////////// ////
序列B:####### CCCCCC ???????? ATCG /////////////////////////// ////
因此,您将获得上述两个序列的三个结果。一个用于'#'部分,另一个用于'?'部分,最后一部分为'/'部分。无论如何,我很高兴有更多的人质疑生物信息学相关的东西。
干杯!