如何使用正则表达式查找非某些模式的内容

时间:2010-12-08 11:23:11

标签: regex perl

使用Perl样式regexp,是否可以寻找不具有某种模式的东西?

例如,[^abc]查找的单个字符不是a,也不是b,也不是c

但我可以指定比单个字符长的东西吗? 例如,在下面的字符串中,我想搜索第一个不是顶级域名并且不包含大写字母的单词,或者可能是一些更复杂的规则,例如3-10个字符。在我的示例中,这应该是"abcd"

net com org edu ABCE abcdefghijklmnoparacbasd abcd

3 个答案:

答案 0 :(得分:5)

您可以使用负前瞻断言来执行此操作:

^(?!(?:net|com|org|edu)$)(?!.*[A-Z])[a-z]{3,10}$

See it

说明:

^                   - Start anchor
$                   - End anchor
(?:net|com|org|edu) - Alternation, matches net or com or org or edu
(?!regex)           - Negative lookahead. 
                      Matches only if the string does not match the regex.

因此,(?!(?:net|com|org|edu)$)部分确保输入不是顶级域之一。

部分(?!.*[A-Z])确保输入没有大写字母。

部分[a-z]{3,10}$确保输入的长度至少为3,最远为10。

答案 1 :(得分:4)

只需使用“不匹配”操作符:!〜

所以只需创建表达式,然后看到变量与它不匹配:

if ($var !~ /abc/) {
  ...
}

答案 2 :(得分:0)

恕我直言,它更容易与regexp匹配,并使用perl进行一些检查。

#!/usr/bin/env perl

use strict;
use warnings;

my $s = "net com org edu ABCE abcdefghijklmnoparacbasd abcd";

# loop short words (a-z might not be what you want though)
foreach( $s =~ /(\b[a-z]{3,10}\b)/g ){
    print $_, "\n" if is_tpl($_);  
}
顺便说一下,有很多顶级域名。