如何构建全局序列比对的评分矩阵?

时间:2013-08-20 00:47:53

标签: java dynamic-programming bioinformatics biometrics

我试图获得两个字符串之间的全局序列对齐。但它给了我错误的答案。 我的生成得分矩阵的方法如下。

public void makeScoringMatrix(String v,String w)
{
    int ar[][]=new int[v.length()+1][w.length()+1];
    for(int i=v.length()-1;i>=0;i--)
    {
        for(int j=w.length()-1;j>=0;j--)
        {
            if(v.charAt(i)==w.charAt(j))
                ar[i][j]=ar[i+1][j+1]+1;
            else if(v.charAt(i)!=w.charAt(j))
                ar[i][j]=ar[i+1][j+1]+0;
            else
                ar[i][j]=Math.max(ar[i][j+1],Math.max(ar[i+1][j],ar[i+1][j+1]));
        }
    }
    //printArray(ar);
    getGlobalAlignment(ar,v,w);
}

public void getGlobalAlignment(int ar[][],String v,String w)
{
    int i=0,j=0,index=0;
    while(i<v.length() && j<w.length())
    {
        if(v.charAt(i)==w.charAt(j))
        {
            System.out.print(v.charAt(i));
            i++;
            j++;
            index++;

        }
        else if(ar[i+1][j]>ar[i][j+1])
        {
            i++;
        }
        else
        {
            j++;
        }
    }

}

有人请帮助我......!

2 个答案:

答案 0 :(得分:1)

您的评分矩阵不正确。如果您打印矩阵,您将看到它如下所示:

    A  T  C  A
A [3, 0, 0, 1, 0]
G [3, 0, 0, 1, 0]
C [3, 0, 0, 1, 0]
A [3, 0, 0, 1, 0]
  [3, 0, 0, 1, 0]

问题是你将v [i]与每个w [j]进行比较时,它只能与最多2个相邻位置(i和i + 1)进行比较。

您还会注意到,当它应该是第一行并且第一列被认为是终值时,最后一列全是0(这就是矩阵长度为+的原因)。

最后,我相信在追溯全局对齐期间,你应该从矩阵中的最后位置开始并向后走(因此术语跟踪 - 返回。当你向前走过你的路线时你比较序列中的序列相似性,而不是矩阵中我认为不正确的分数。

你应该查看关于Needleman-Wunsch的维基百科文章http://en.wikipedia.org/wiki/Needleman-Wunsch_algorithm或阅读其中一本算法书; Durbin等人的生物序列分析是涵盖成对比对的经典(但非常难以理解)的书。

答案 1 :(得分:0)

试试这段代码......

public void makeMatrix(String v,String w)
{
    int[][] maxDist=new int[v.length()+1][w.length()+1];
    for(int i=0;i<=v.length();i++)
    {
        for(int j=0;j<=w.length();j++)
        {
            if(i==0)
                maxDist[i][j]=-j;
            else if(j==0)
                maxDist[i][j]=-i;
            else
                maxDist[i][j]=0;
        }
    }
    fillMatrix(maxDist, v, w);
}

public int weight(String v,String w,int i,int j)
{
    if(v.charAt(i-1)==w.charAt(j-1))
        return 1;
    else
        return -1;
}

public void fillMatrix(int[][] ar,String v,String w)
{
    for(int i=1;i<=v.length();i++)
    {
        for(int j=1;j<=w.length();j++)
        {
            int scoreDiagonal=ar[i-1][j-1]+weight(v, w, i, j);
            int scoreLeft=ar[i][j-1]-1;
            int scoreUp=ar[i-1][j]-1;

            ar[i][j]=Math.max(scoreDiagonal, Math.max(scoreLeft, scoreUp));
        }
    }
}

希望这是您正在寻找的代码......