应用错误收集

计算两个序列之间相似性的复杂性

时间：2013-02-09 03:01:43

标签： algorithm complexity-theory bioinformatics dna-sequence

计算两个序列之间相似性的最着名算法的计算复杂度是什么（如DNA或蛋白质比对/近似字符串匹配）？

相似性基于：

使用substitution scoring matrices对比对（对Protein alphabet中的20个符号或DNA字母表中的4个符号进行全局或位置特定的替换）
Gap Penalty

Burrows–Wheeler transform和Bowtie短读取对齐器中使用的BWA的线性时间是否是实际的最新技术，还是存在解决相同问题的子线性算法？

[编辑]：考虑将LSH应用于近似匹配，假设对参考数据集进行预处理/索引，这将是次线性的

1 个答案:

答案 0 :(得分：1)

我想在某些时候你最终会读完整个序列，所以不能有一个亚线性时间算法。