如何使用替换矩阵修改Smith-Waterman algorithm来对齐Perl中的蛋白质?
[需要引用]
答案 0 :(得分:5)
我实际上是一名生物信息学研究员,正在等待自己的生物信息学代码运行,所以我会尝试回答你的问题,即使它的构成相当糟糕。
我不确定为什么你认为你需要“修改”Smith-Waterman算法。 Smith-Waterman算法唯一需要对齐蛋白质而不是DNA的是蛋白质的替代基质。看看BLOSUM或PAM。这些是基于很久以前一些生物学家手工排列的序列中各种氨基酸对的取代频率。
构建蛋白质序列的替换矩阵比DNA序列复杂得多。例如,你期望一种亲水性氨基酸相对频繁地替代另一种,因为它通常能够这样做而不会导致蛋白质失去功能。但是,您不会期望疏水性氨基酸经常替代亲水性氨基酸,因为这会更彻底地改变蛋白质结构。
如果将替换矩阵视为输入而不是算法的一部分,Smith-Waterman算法虽然通常应用于DNA或蛋白质,但在技术上是一般的字符串对齐算法。
答案 1 :(得分:2)
也许从Bio::Tools::pSW开始,尝试按照您想要的方式对其进行修改,并在遇到困难时提出具体问题。