评估BLASTn评分的重要性?

时间:2009-11-23 05:49:41

标签: bioinformatics

我正在运行独立命令行blast以将许多查询序列与核苷酸的大型数据库序列对齐。我可以修改blastn程序的命令行参数来改变各种参数,比如匹配/不匹配分数。

我想知道 - 对于blastn输出的'比特得分',比较具有相同查询和数据库序列但不同匹配/不匹配参数的比对的比特得分是否有意义?我正在尝试用各种参数值评估爆炸的表现,但我想确保一切都在平等的基础上进行比较。感谢。

3 个答案:

答案 0 :(得分:1)

我不清楚为什么你认为比较比特分数会让你深入了解BLAST的表现。通常的做法

不幸的是,BLAST和其他对齐程序的大部分工作都是基于查看局部的无空位对齐,并根据经验将那些理论扩展到有缺口的对齐。特别是,比特分数计算如下:

S' = ( lambda * S - ln(K) ) / ln(2)

在上面的公式中,K和lambda是替换矩阵的常数,S是分数(替换和差距分数之和),S'是比特分数。这意味着您的位分数肯定会因为改变间隙开放/间隙扩展参数而发生变化,这意味着您的比较无效。这是一个令人遗憾的结果,因为关于缺口比对的理论很少,因此必须根据经验测量给定系统的最佳间隙分数。

由于比特分数不具有可比性,我建议您根据不涉及比对分数的备用数据集进行评估。例如,如果我对用于比较蛋白质序列的最佳间隙开放/间隙延伸参数感兴趣,我可以查看已知结构的蛋白质并基于其能力评估每个参数集使得具有结构意义的比对。这避免了完全比较对齐分数,这是好的,因为比较它们自己的比特分数显然不是很有用。

答案 1 :(得分:0)

我不确定你能做到这一点。 你真的需要改变匹配/不匹配参数吗?你的目标是什么?

答案 2 :(得分:0)

比特分数不具有可比性并不一定正确。来自NCBI网站上的BLAST文档:

“比特分数被归一化,这意味着即使使用了不同的评分矩阵,也可以比较不同比对的比特分数。”

http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=handbook&part=ch16