计算两个序列之间相似性的最着名算法的计算复杂度是什么(如DNA或蛋白质比对/近似字符串匹配)?
相似性基于:
使用substitution scoring matrices对比对(对Protein alphabet中的20个符号或DNA字母表中的4个符号进行全局或位置特定的替换)
Burrows–Wheeler transform和Bowtie短读取对齐器中使用的BWA的线性时间是否是实际的最新技术,还是存在解决相同问题的子线性算法?
[编辑]:考虑将LSH应用于近似匹配,假设对参考数据集进行预处理/索引,这将是次线性的
答案 0 :(得分:1)
我想在某些时候你最终会读完整个序列,所以不能有一个亚线性时间算法。