所以我现在坚持这个问题: LIST说,我宣布一份不变的清单 2.我想通读一个文件,我在一个while循环中逐行读取,如果该行有一个来自LIST的关键字,我打印该行,或者是这样的东西。
这就是我目前的情况:
use constant LIST => ('keyword1', 'keyword2', 'keyword3');
sub main{
unless(open(MYFILE, $file_read)){die "Error\n"};
while(<MYFILE>){
my $line = $_;
chomp($line);
if($line =~ m//){#here is where i'm stuck, i want is if $line has either of the keywords
print $line;
}
}
}
我应该在if语句中做什么来匹配我希望程序做的事情?我可以在没有$line
变量且只使用$_
的情况下这样做吗?我只使用$ line因为我认为grep会自动将LIST中的常量放入$_
。
谢谢!
答案 0 :(得分:2)
最简单的方法是将引用的正则表达式定义为常量而不是列表:
use strict;
use warnings;
use autodie; # Will kill program on bad opens, closes, and writes
use feature qw(say); # Better than "print" in most situations
use constant {
LIST => qr/keyword1|keyword2|keyword3/, # Now a regular expression.
FILE_READ => 'file.txt', # You're defining constants, make this one too.
};
open my $read_fh, "<", FILE_READ; # Use scalars for file handles
# This isn't Java. You don't have to define "main" subroutine
while ( my $line = <$read_fh> ) {
chomp $line;
if ( $line =~ LIST ) { #Now I can use the constant as a regex
say $line;
}
}
close $read_fh;
顺便说一句,如果你不使用 autodie ,打开文件的标准方法如果没有打开则失败是使用or
语法:
open my $fh, "<", $file_name or die qq(Can't open file "$file_name": $!);
如果必须使用列表作为常量,则可以使用join
来生成正则表达式:
use constant LIST => qw( keyword1 keyword2 keyword3 );
...
my $regex = join "|", map LIST;
while ( my $line = <$file_fh> ) {
chomp $line;
if ( $line =~ /$regex/ ) {
say $line;
}
}
join
获取一个列表(在本例中为常量列表),并用你给它的字符串或字符分隔每个成员。我希望您的关键字不包含特殊的正则表达式字符。否则,您需要引用这些特殊字符。
我的$ regex =加入'|' =&GT; map + quotemeta,LIST; - 扎伊德
谢谢扎伊德。我以前不知道quotemeta
命令。我一直在尝试使用\Q
和\E
进行各种操作,但它开始变得过于复杂。
做Zaid所做的另一种方式:
my @list = map { quotemeta } LIST;
my $regex = join "|", @list;
初学者理解map有点困难。 map
获取LIST
中的每个元素并对其运行quotemeta命令。这将返回 list ,我将其分配给@list
。
想象:
use constant LIST => qw( periods.are special.characters in.regular.expressions );
当我跑步时:
my @list = map { quotemeta } LIST;
返回列表:
my @list = ( "periods\.are", "special\.characters", "in\.regular\.expressions" );
现在,句点是文字句点而不是正则表达式中的特殊字符。我跑的时候:
my $regex = join "|", @list;
我明白了:
$regex = "periods\.are|special\.characters|in\.regular\.expressions";
这是一个有效的正则表达式。