Perl如何从文件中打印唯一对

时间:2012-08-31 07:23:24

标签: regex arrays perl

我试图弄清楚如何使用Perl从文件中打印唯一的数据对。

例如,

Input: (check.pl)
A23072 A25058
A25058 A23072 
Output:
A23072 A25058

为了解决这个问题,我创建了一个check.pl文件的副本,并通过它重复查找正则表达式。我编写了以下代码,但我无法过滤数据。

#!/usr/bin/perl -w
use strict;
use warnings;
open FH, "<check.txt" || die "Error\n";
open FH1, "<checkcopy.txt" || die "Error\n";
chomp (my @array=<FH1>);
my %count=();

while (<FH>) 
{
my @values = split;
next if grep /\D/, @values or @values != 2;

my $re = qr/\A$values[0]\s+$values[1]\z|\A$values[1]\s+$values[0]\z/;

   foreach my $key (@array) 
   {
      if ((grep $_ =~ $re, $key) && (grep ++$count{$_} == 1, $key) )
      {
        print "$key\n";
      }
   }    
}
1;

任何帮助将不胜感激!感谢。

2 个答案:

答案 0 :(得分:3)

您可以将值存储在哈希中,这样可以更容易地查找它们。类似的东西:

my %duplicates;
while (<>) {
  my @values = split;
  next if @values != 2;

  my @sorted  = sort @values;
  $duplicates{ $sorted[0] } ||= {};
  next if $duplicates{ $sorted[0] }->{ $sorted[1] };

  $duplicates{ $sorted[0] }->{ $sorted[1] } = 1;
  print join(' ', @values), "\n";
}

答案 1 :(得分:0)

以下是我使用sort查看类似问题的技巧。

#!/usr/bin/perl
use strict;
use warnings;

my %seen;
my @array;

while (<DATA>) {
    next unless 2 == (@array = split);
    my $key = join "", sort @array;
    print unless $seen{$key}++;
}

__DATA__
A23072 A25058
A25058 A23072