Contig Extension - 搜索最小的扩展名

时间:2016-06-05 13:22:09

标签: python algorithm biopython

我想编写一个将重叠群(重叠的dna序列)扩展成大型的功能。为此,我需要从由这些序列组成的字典中找到重叠序列作为键和值。 我需要在初始序列的右侧和左侧找到“最小的扩展”,但我无法想出如何实际寻找最小的序列。我还在阅读文档,但到目前为止还没有找到任何有用的东西,所以如果有人能指出我的方法或告诉我如何得到没有任何扩展但是最小的我会非常感激。

1 个答案:

答案 0 :(得分:0)

如果您通过小读取扩展重叠群,请使用10,如下所示: http://sco.h-its.org/exelixis/web/software/pear/doc.html

否则,如果连接大的重叠群,可能有10%的长度可能有用吗? 您可以使用阈值10%并删除匹配的序列。接下来,将阈值降低到长度的8%并再次进行匹配。

你不应该低于10。