Perl Regex匹配超过2个字符的单词

时间:2012-11-12 21:20:57

标签: perl

我是PERL的新手,正在制作正则表达式,只匹配等于或大于3个字母的单词。这是我正在尝试的程序。我尝试添加\ w {3,},因为它应该匹配3个以上的字符。但它仍然匹配一个单词中的< 3个字符。例如,如果我给出“这是一个模式”。我希望我的$ field只匹配“This”和“Pattern”并跳过“is”和“a”。

#!/usr/bin/perl
     while (<STDIN>) {
           foreach my $reg_part (split(/\s+/, $_)) {
                if ($reg_part =~ /([^\w\@\.]*)?([\w{3,}\@\(\)\+\$\.]+)(?::(.+))?/) {
                        print "reg_part = $reg_part \n";
                        my ($mod, $field, $pat) = ($1, $2, $3);
                        print "#$mod#$field#$pat#$negate#\n";
                }
        }
}

exit(0);

我错过了什么?

2 个答案:

答案 0 :(得分:4)

打破你的正则表达式。

您知道您需要三个单词字符,因此请指定: -

# Match three word characters.

\w{3}

之后,你真的不在乎这个单词是否包含更多字符,但你也不会阻止它。

# Match 0 or more word characters
\w*

最后,您希望确保有边界来捕捉单词的结尾。所以,把它们放在一起。要将一个单词与至少三个单词字符(可能更多)匹配,请使用: -

# Word boundaries at start and end    
\b\w{3}\w*\b

注意 - \w匹配字母数字 - 如果它只是alpha,则需要: -

# Alpha only
\b[A-Za-z]{3}[A-Za-z]*\b

答案 1 :(得分:3)

你有

[\w{3,}...]+

相同
[{},3\w...]+

我想你想要

(?:\w{3,}|[\$\@()+.])+