Perl正则表达式多行匹配无点

时间:2016-05-24 13:53:09

标签: regex perl multiline exact-match

关于如何在Perl中执行多行正则表达式有很多问题。他们中的大多数都提到了s开关,它使点匹配换行。但是,我想匹配一个确切的短语(所以,不是一个模式),我不知道新线将在哪里。问题是:您可以忽略换行符,而不是将它们与.匹配吗?

MWE:

$pattern = "Match this exact phrase across newlines";

$text1 = "Match\nthis exact\nphrase across newlines";
$text2 = "Match this\nexact phra\nse across\nnewlines";

$text3 = "Keep any newlines\nMatch this exact\nphrase across newlines\noutside\nof the match";

$text1 =~ s/$pattern/replacement text/s;
$text2 =~ s/$pattern/replacement text/s;
$text3 =~ s/$pattern/replacement text/s;

print "$text1\n---\n$text2\n---\n$text3\n";

我可以在模式中添加点而不是空格("Match.this.exact.phrase"),但这不适用于第二个示例。我可以删除所有新行作为预处理,但我想保留不属于匹配的换行符(如第三个示例中所示)。

期望的输出:

replacement text
---
replacement text
---
Keep any newlines
replacement text
outside
of the match

4 个答案:

答案 0 :(得分:3)

只需用与空格或换行符匹配的字符类替换文字空格:

$pattern = "Match[ \n]this[ \n]exact[ \n]phrase[ \n]across[ \n]newlines";

或者,如果您想要更宽容,请改用\s\s+,因为\s也匹配换行符。

答案 1 :(得分:3)

大多数情况下,您将换行视为空格。如果这就是您想要做的,那么您需要的只是

$text =~ s/\n/ /g;
$text =~ /\Q$text_to_find/    # or $text =~ /$regex_pattern_to_match/

然后有一次你想忽略它。如果这就是您想要做的,那么您需要的只是

$text =~ s/\n//g;
$text =~ /\Q$text_to_find/    # or $text =~ /$regex_pattern_to_match/

如果要匹配正则表达式模式,则两者都是不可能的。但是你似乎想要匹配文字文本,这样就开辟了一些可能性。

( my $pattern = $text_to_find )
   =~ s/(.)/ $1 eq " " ? "[ \\n]" : "\\n?" . quotemeta($1) /seg;
$pattern =~ s/^\\n\?//;
$text =~ /$pattern/

答案 2 :(得分:2)

听起来你想改变你的“精确”模式以匹配任何地方的换行符,并且还允许换行符而不是空格。所以改变你的模式:

$pattern = "Match this exact phrase across newlines";
$pattern =~ s/\S\K\B/\n?/g;
$pattern =~ s/ /[ \n]/g;

答案 3 :(得分:1)

这当然很难看,但它有效:

M\n?a\n?t\n?c\n?h\st\n?h\n?i\n?s\se\n?x\n?a\n?ct\sp\n?h\n?r\n?a\n?s\n?e\sa\n?c\n?r\n?o\n?s\n?s\sn\n?e\n?w\n?l\n?i\n?n\n?e\n?s

对于单词中的每对字母,请在\n?之间使用换行符。并使用\s替换正则表达式中的每个空格。

可能无法使用,但它可以完成工作;)

Check it out at regex101