我试图获得两个字符串之间的全局序列对齐。但它给了我错误的答案。 我的生成得分矩阵的方法如下。
public void makeScoringMatrix(String v,String w)
{
int ar[][]=new int[v.length()+1][w.length()+1];
for(int i=v.length()-1;i>=0;i--)
{
for(int j=w.length()-1;j>=0;j--)
{
if(v.charAt(i)==w.charAt(j))
ar[i][j]=ar[i+1][j+1]+1;
else if(v.charAt(i)!=w.charAt(j))
ar[i][j]=ar[i+1][j+1]+0;
else
ar[i][j]=Math.max(ar[i][j+1],Math.max(ar[i+1][j],ar[i+1][j+1]));
}
}
//printArray(ar);
getGlobalAlignment(ar,v,w);
}
public void getGlobalAlignment(int ar[][],String v,String w)
{
int i=0,j=0,index=0;
while(i<v.length() && j<w.length())
{
if(v.charAt(i)==w.charAt(j))
{
System.out.print(v.charAt(i));
i++;
j++;
index++;
}
else if(ar[i+1][j]>ar[i][j+1])
{
i++;
}
else
{
j++;
}
}
}
有人请帮助我......!
答案 0 :(得分:1)
您的评分矩阵不正确。如果您打印矩阵,您将看到它如下所示:
A T C A
A [3, 0, 0, 1, 0]
G [3, 0, 0, 1, 0]
C [3, 0, 0, 1, 0]
A [3, 0, 0, 1, 0]
[3, 0, 0, 1, 0]
问题是你将v [i]与每个w [j]进行比较时,它只能与最多2个相邻位置(i和i + 1)进行比较。
您还会注意到,当它应该是第一行并且第一列被认为是终值时,最后一列全是0(这就是矩阵长度为+的原因)。
最后,我相信在追溯全局对齐期间,你应该从矩阵中的最后位置开始并向后走(因此术语跟踪 - 返回。当你向前走过你的路线时你比较序列中的序列相似性,而不是矩阵中我认为不正确的分数。
你应该查看关于Needleman-Wunsch的维基百科文章http://en.wikipedia.org/wiki/Needleman-Wunsch_algorithm或阅读其中一本算法书; Durbin等人的生物序列分析是涵盖成对比对的经典(但非常难以理解)的书。
答案 1 :(得分:0)
试试这段代码......
public void makeMatrix(String v,String w)
{
int[][] maxDist=new int[v.length()+1][w.length()+1];
for(int i=0;i<=v.length();i++)
{
for(int j=0;j<=w.length();j++)
{
if(i==0)
maxDist[i][j]=-j;
else if(j==0)
maxDist[i][j]=-i;
else
maxDist[i][j]=0;
}
}
fillMatrix(maxDist, v, w);
}
public int weight(String v,String w,int i,int j)
{
if(v.charAt(i-1)==w.charAt(j-1))
return 1;
else
return -1;
}
public void fillMatrix(int[][] ar,String v,String w)
{
for(int i=1;i<=v.length();i++)
{
for(int j=1;j<=w.length();j++)
{
int scoreDiagonal=ar[i-1][j-1]+weight(v, w, i, j);
int scoreLeft=ar[i][j-1]-1;
int scoreUp=ar[i-1][j]-1;
ar[i][j]=Math.max(scoreDiagonal, Math.max(scoreLeft, scoreUp));
}
}
}
希望这是您正在寻找的代码......