所以我的问题是尝试实现Needleman Wunsch算法和用于垂直和水平耗尽内存的gapcores并且没有正确实现。它可能是一个简单的循环错误记忆,但对于我的生活,我无法看到它。这是代码:
$seq1 = "ACTTCAATCGGT";
$seq2 = "ACTGGTCAATCGGT";
$len1 = length($seq1);
$len2 = length($seq2);
上面的序列。
@matrix = ();
my $gapscore = -1;
my $matchscore = 1;
my $mismatchscore = 0;
$matrix[0][0] = 0;
# initialize 1st row and 1st column of matrix decreasing by $gapscore
for ($i = 1; $i < $len1; $i++) {
$matrix[$i][0] = $gapscore;
$gapscore--;
}
$gapscore = -1;
for ($j = 1; $j < $len2; $j++) {
$matrix[0][$j] = $gapscore;
$gapscore--;
}
$gapscore = -1;
因此上面的代码正确地实现了矩阵点,其中0 ... n和0 ... n水平和垂直。下一个代码尝试通过填充矩阵中的其余值来实现矩阵。
for($x = 1; $x < $len2; $x++) { # going through sequence1
for($y = 1; $y < $len1; $y++) { # going through sequence2
my ($diagonal, $horizontal, $vertical);
my $Firstletter = substr($seq1,$x-1,1);
my $Secondletter = substr($seq2,$y-1,1);
# gap scores:
$vertical = $matrix[$x-1][$y] + $gapscore;
$horizontal = $matrix[$x][$y-1] + $gapscore;
# matching scores on diagonal:
if($Firstletter eq $Secondletter) {
$diagonal = $matrix[$x-1][$y-1] + $matchscore;
}
else {
$diagonal = $matrix[$x-1][$y-1] + $mismatchscore;
}
}
}
垂直和水平变量导致内存问题。我不确定为什么。如果有人能提供一些见解我会非常感激!
答案 0 :(得分:1)
for($x = 1; $x < $len2; $x++) { # going through sequence1
for($y = 1; $y < $len1; $y++) { # going through sequence2
错误,第一个循环,如所写,经过sequence2
,第二个循环经过sequence1
。
所以看起来你已经颠倒了你的索引。这可能导致索引超出范围错误,并且在某些情况下也会导致执行时间变慢。
可能的解决方法:在上面的代码中交换len2
和len1
。
答案 1 :(得分:1)
我无法理解为什么你的内存不足,但是你有一些错误的错误。矩阵比序列1中的碱基多一列,比序列2中的碱基多一列。这意味着你的指数应该从0到$len1
和0到$len2
,但是你正在停止一个短暂的。
这应该对你有所帮助。它正确地构建了数组,但我还没有编写下一步来跟踪通过对角线的最佳路径。
use strict;
use warnings;
use List::Util 'max';
STDOUT->autoflush;
my ($seq1, $seq2) = qw/ ACTTCAATCGGT ACTGGTCAATCGGT /;
my ($len1, $len2) = map length, $seq1, $seq2;
my @seq1 = $seq1 =~ /./g;
my @seq2 = $seq2 =~ /./g;
my @matrix;
$matrix[$_][0] = -$_ for 0 .. $len2;
$matrix[0][$_] = -$_ for 0 .. $len1;
for my $x ( 1 .. $len2 ) { # Rows (bases of sequence 2)
for my $y ( 1 .. $len1 ) { # Columns (bases of sequence 1)
my $match = $seq1[$y-1] eq $seq2[$x-1];
my @scores = (
$matrix[$x-1][$y] - 1, # Up
$matrix[$x][$y-1] - 1, # Left
$match ? $matrix[$x-1][$y-1] + 1 : $matrix[$x-1][$y-1] - 1, # Diagonal
);
$matrix[$x][$y] = max @scores;
}
}
for my $i ( 0 .. $len2 ) {
my $row = $matrix[$i];
print join(' ', map { sprintf '%3d', $_ } @$row), "\n";
}
<强>输出强>
0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12
-1 1 0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10
-2 0 2 1 0 -1 -2 -3 -4 -5 -6 -7 -8
-3 -1 1 3 2 1 0 -1 -2 -3 -4 -5 -6
-4 -2 0 2 2 1 0 -1 -2 -3 -2 -3 -4
-5 -3 -1 1 1 1 0 -1 -2 -3 -2 -1 -2
-6 -4 -2 0 2 1 0 -1 0 -1 -2 -2 0
-7 -5 -3 -1 1 3 2 1 0 1 0 -1 -1
-8 -6 -4 -2 0 2 4 3 2 1 0 -1 -2
-9 -7 -5 -3 -1 1 3 5 4 3 2 1 0
-10 -8 -6 -4 -2 0 2 4 6 5 4 3 2
-11 -9 -7 -5 -3 -1 1 3 5 7 6 5 4
-12 -10 -8 -6 -4 -2 0 2 4 6 8 7 6
-13 -11 -9 -7 -5 -3 -1 1 3 5 7 9 8
-14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10