用于部分匹配ip或mac地址的Perl正则表达式

时间:2012-06-04 23:41:32

标签: regex perl

我正在编写一个优化,您正在执行搜索我的应用程序,如果字符串看起来像一个IP地址,那么不要费心搜索MAC地址。如果搜索看起来像MAC地址,请不要费心查看IP地址db列。

我已经看到完全匹配ips和mac地址的表达式,但很难找到匹配部分字符串和非常有趣的脑筋急转弯的表达式,我想我会得到其他人的意见。现在我有一个没有正则表达式的解决方案。

use List::Util qw(first);

sub query_is_a_possible_mac_address {
  my ($class, $possible_mac) = @_;
  return 1 unless $possible_mac;

  my @octets = split /:/, $possible_mac, -1;
  return 0 if scalar @octets > 6; # fail long MACS
  return 0 if (first { $_ !~ m/[^[:xdigit:]]$/ } @octets; # fail any non-hex characters
  return not first { hex  $_ > 2 ** 8 }; # fail if the number is too big
}

# valid tests
'12:34:56:78:90:12'
'88:11:'
'88:88:F0:0A:2B:BF'
'88'
':81'
':'
'12:34'
'12:34:'
'a'
''

# invalid tests
'88:88:F0:0A:2B:BF:00'
'88z'
'8888F00A2BBF00'
':81a'
'881'
' 88:1B'
'Z'
'z'
'a12:34'
' '
'::88:'

2 个答案:

答案 0 :(得分:1)

鉴于(新)测试,这有效:

/^[0-9A-Fa-f]{0,2}(:[0-9A-Fa-f]{2}){0,5}:?$/

以下是在给定上述测试的情况下匹配的行(请注意,单个十六进制字符如'a'和'A'正确匹配:

12:34:56:78:90:12
88:11:
88:88:F0:0A:2B:BF
88
:81
:
12:34
12:34:
a
'' (<-- empty space)

答案 1 :(得分:0)

我发现这样做的最好方法是尝试让可能的匹配成为你想要匹配的东西。例如,如果您有一个字符串:1.2,请尝试使其看起来像一个IP地址:1.2.1.1。然后应用正则表达式

sub contains_ip {
    my ($possible_ip) = @_;

    my @splits = split /\./, $possible_ip;

    return 0 if @splits > 4;
    while (@splits < 4) {
        push @splits, '1';
    }

    $possible_ip = join '.', @splits;

    my ($match) = $possible_ip =~ m/^(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$/;
    return defined $match ? 1 : 0;
}

warn contains_ip('1.2'); # 1
warn contains_ip('127.0.0.1'); # 1
warn contains_ip('1.2asd'); # 0
warn contains_ip('1.2.3.4.5'); # 0

同样的事情适用于mac地址: 如果您有11:22,请尝试使其看起来像一个完全限定的MAC地址,11:22:00:00:00:00,然后将mac地址正则表达式应用于它。