我试图弄清楚如何使用Perl从文件中打印唯一的数据对。
例如,
Input: (check.pl)
A23072 A25058
A25058 A23072
Output:
A23072 A25058
为了解决这个问题,我创建了一个check.pl文件的副本,并通过它重复查找正则表达式。我编写了以下代码,但我无法过滤数据。
#!/usr/bin/perl -w
use strict;
use warnings;
open FH, "<check.txt" || die "Error\n";
open FH1, "<checkcopy.txt" || die "Error\n";
chomp (my @array=<FH1>);
my %count=();
while (<FH>)
{
my @values = split;
next if grep /\D/, @values or @values != 2;
my $re = qr/\A$values[0]\s+$values[1]\z|\A$values[1]\s+$values[0]\z/;
foreach my $key (@array)
{
if ((grep $_ =~ $re, $key) && (grep ++$count{$_} == 1, $key) )
{
print "$key\n";
}
}
}
1;
任何帮助将不胜感激!感谢。
答案 0 :(得分:3)
您可以将值存储在哈希中,这样可以更容易地查找它们。类似的东西:
my %duplicates;
while (<>) {
my @values = split;
next if @values != 2;
my @sorted = sort @values;
$duplicates{ $sorted[0] } ||= {};
next if $duplicates{ $sorted[0] }->{ $sorted[1] };
$duplicates{ $sorted[0] }->{ $sorted[1] } = 1;
print join(' ', @values), "\n";
}
答案 1 :(得分:0)
以下是我使用sort
查看类似问题的技巧。
#!/usr/bin/perl
use strict;
use warnings;
my %seen;
my @array;
while (<DATA>) {
next unless 2 == (@array = split);
my $key = join "", sort @array;
print unless $seen{$key}++;
}
__DATA__
A23072 A25058
A25058 A23072