perl比较两个字符串并突出显示不匹配字符

时间:2013-05-21 23:56:04

标签: perl

string1 = "AAABBBBBCCCCCDDDDD"
string2 = "AEABBBBBCCECCDDDDD"

输出。如果不匹配(在本例中为E)将被替换为围绕E的HTML标签,则为其着色。

A**E**ABBBBBCC**E**CCDDDDD

到目前为止我尝试过:XOR,diff和substr。首先,我需要找到索引,然后用模式替换这些索引。

6 个答案:

答案 0 :(得分:9)

my @x = split '', "AAABBBBBCCCCCDDDDD";
my @y = split '', "AEABBBBBCCECCDDDDD";

my $result = join '',
             map { $x[$_] eq $y[$_] ? $y[$_] : "**$y[$_]**" }
             0 .. $#y;

答案 1 :(得分:7)

use strict;
use warnings;
my $string1 = 'AAABBBBBCCCCCDDDDD';
my $string2 = 'AEABBBBBCCECCDDDDD';
my $result = '';
for(0 .. length($string1)) {
    my $char = substr($string2, $_, 1);
    if($char ne substr($string1, $_, 1)) {
        $result .= "**$char**";
    } else {
        $result .= $char;
    }
}
print $result;

打印A**E**ABBBBBCC**E**CCDDDDD

有点测试。可能包含错误。

答案 2 :(得分:4)

use warnings;
use strict;
my ($s1, $s2, $o1, $o2) = ("AAABBBBBCCCCCDDDDD", "AEABBBBBCCECCDDDDD");
my @s1 = split(//, $s1);
my @s2 = split(//, $s2);
my $eq_state = 1;
while (@s1 and @s2) {
    if (($s1[0] eq $s2[0]) != $eq_state) {
        $o1 .= (!$eq_state) ? "</b>" : "<b>";
        $o2 .= (!$eq_state) ? "</b>" : "<b>";
    }
    $eq_state = $s1[0] eq $s2[0];
    $o1.=shift @s1;
    $o2.=shift @s2;
}
print "$o1\n$o2\n";

<强>输出

A<b>A</b>ABBBBBCC<b>C</b>CCDDDDD
A<b>E</b>ABBBBBCC<b>E</b>CCDDDDD

只打印出第二个字符串的更简单的一个:

use warnings;
use strict;
my ($s1, $s2, $was_eq) = ("AAABBBBBCCCCCDDDDD", "AEABBBBBCCECCDDDDD", 1); 
my @s1 = split(//, $s1);
my @s2 = split(//, $s2);
for my $idx (0 .. @s2 -1) {
    my $is_eq = $s1[$idx] eq $s2[$idx];
    print $is_eq ? "</b>" : "<b>" if ( $was_eq != $is_eq);
    $was_eq = $is_eq;
    print $s2[$idx];
}

<强> Outout

</b>A<b>E</b>ABBBBBCC<b>E</b>CCDDDDD

答案 3 :(得分:3)

对于大字符串,这可能是内存密集型的。

use strict; 
use warnings;

my $a = "aabbcc";
my $b = "aabdcc";

my @a = split //, $a;
my @b = split //, $b;

my $new_b = '';

for(my $i = 0; $i < scalar(@a); $i++) {
    $new_b .= $a[$i] eq $b[$i] ? $b[$i] : "**$b[$i]**";
}

输出:

$ test.pl
new_b: aab**d**cc

答案 4 :(得分:2)

有几种方法可以实现这一目标。以下是解决此问题的可能方法。

my $str1="ABCDEA";
my $str2="AECDEB";
my @old1=split("",$str1);
my @old2=split("",$str2);

my @new;

for my $i (0..$#old1) {
        if ($old1[$i] eq $old2[$i] ) {
                push (@new, $old2[$i]);
        }
        else
        {
                my $elem = "**".$old2[$i]."**";
                push (@new , $elem);
        }
}
print @new;

输出结果为:

A**E**CDE**B**

答案 5 :(得分:2)

对齐列并使用按位字符串运算符&#34; ^&#34;:

my $a = "aabbccP";
my $b = "aabdccEE";
$_ = $a ^ $b;
s/./ord $& ? "^" : " "/ge;
print "$_\n" for $a, $b, $_;

给出:

aabbccP
aabdccEE
   ^  ^^