如何在perl中的正则表达式中包含grep

时间:2013-09-10 00:41:52

标签: regex perl grep

所以我现在坚持这个问题: LIST说,我宣布一份不变的清单 2.我想通读一个文件,我在一个while循环中逐行读取,如果该行有一个来自LIST的关键字,我打印该行,或者是这样的东西。

这就是我目前的情况:

use constant LIST => ('keyword1', 'keyword2', 'keyword3');
sub main{
    unless(open(MYFILE, $file_read)){die "Error\n"};
    while(<MYFILE>){
        my $line = $_;
        chomp($line);
        if($line =~ m//){#here is where i'm stuck, i want is if $line has either of the keywords
            print $line;
        }
    }
}

我应该在if语句中做什么来匹配我希望程序做的事情?我可以在没有$line变量且只使用$_的情况下这样做吗?我只使用$ line因为我认为grep会自动将LIST中的常量放入$_。 谢谢!

1 个答案:

答案 0 :(得分:2)

最简单的方法是将引用的正则表达式定义为常量而不是列表:

use strict;
use warnings;
use autodie;    # Will kill program on bad opens, closes, and writes
use feature qw(say);   # Better than "print" in most situations

use constant {
   LIST => qr/keyword1|keyword2|keyword3/, # Now a regular expression.
   FILE_READ => 'file.txt', # You're defining constants, make this one too.
};

open my $read_fh, "<", FILE_READ;  # Use scalars for file handles

# This isn't Java. You don't have to define "main" subroutine

while ( my $line = <$read_fh> ) {
    chomp $line;
    if ( $line =~ LIST ) {  #Now I can use the constant as a regex
        say $line;
    }
}
close $read_fh;

顺便说一句,如果你不使用 autodie ,打开文件的标准方法如果没有打开则失败是使用or语法:

open my $fh, "<", $file_name or die qq(Can't open file "$file_name": $!);

如果必须使用列表作为常量,则可以使用join来生成正则表达式:

use constant LIST => qw( keyword1 keyword2 keyword3 );

...

my $regex = join "|", map LIST;
while ( my $line = <$file_fh> ) {
    chomp $line;
    if ( $line =~ /$regex/ ) {
        say $line;
    }
}

join获取一个列表(在本例中为常量列表),并用你给它的字符串或字符分隔每个成员。我希望您的关键字不包含特殊的正则表达式字符。否则,您需要引用这些特殊字符。


附录

  

我的$ regex =加入'|' =&GT; map + quotemeta,LIST; - 扎伊德

谢谢扎伊德。我以前不知道quotemeta命令。我一直在尝试使用\Q\E进行各种操作,但它开始变得过于复杂。

做Zaid所做的另一种方式:

my @list = map { quotemeta } LIST;
my $regex = join "|", @list;

初学者理解map有点困难。 map获取LIST中的每个元素并对其运行quotemeta命令。这将返回 list ,我将其分配给@list

想象:

use constant LIST => qw( periods.are special.characters in.regular.expressions );

当我跑步时:

my @list = map { quotemeta } LIST;

返回列表:

my @list = ( "periods\.are", "special\.characters", "in\.regular\.expressions" );

现在,句点是文字句点而不是正则表达式中的特殊字符。我跑的时候:

my $regex = join "|", @list;

我明白了:

$regex = "periods\.are|special\.characters|in\.regular\.expressions";

这是一个有效的正则表达式。