计算两个序列之间相似性的复杂性

时间:2013-02-09 03:01:43

标签: algorithm complexity-theory bioinformatics dna-sequence

计算两个序列之间相似性的最着名算法的计算复杂度是什么(如DNA或蛋白质比对/近似字符串匹配)?

相似性基于:

  1. 使用substitution scoring matrices对比对(对Protein alphabet中的20个符号或DNA字母表中的4个符号进行全局或位置特定的替换)

  2. Gap Penalty

  3. Burrows–Wheeler transformBowtie短读取对齐器中使用的BWA的线性时间是否是实际的最新技术,还是存在解决相同问题的子线性算法?

    [编辑]:考虑将LSH应用于近似匹配,假设对参考数据集进行预处理/索引,这将是次线性的

1 个答案:

答案 0 :(得分:1)

我想在某些时候你最终会读完整个序列,所以不能有一个亚线性时间算法。