当我使用捕获组制作regex
变量时,整个匹配正常,但捕获组为Nil
。
my $str = 'nn12abc34efg';
my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;
$str ~~ / $rgx / ;
say ~$/; # 12abc34
say $0; # Nil
say $1; # Nil
如果我修改程序以避免$rgx
,一切都按预期工作:
my $str = 'nn12abc34efg';
my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;
$str ~~ / ($atom) \w+ ($atom) /;
say ~$/; # 12abc34
say $0; # 「12」
say $1; # 「34」
答案 0 :(得分:5)
使用您的代码,编译器会发出以下警告:
Regex object coerced to string (please use .gist or .perl to do that)
这告诉我们一些事情是错的 - 正则表达式不应该被视为字符串。嵌套正则表达式还有两种正确的方法。首先,您可以在断言(<>
)中包含子正则表达式:
my $str = 'nn12abc34efg';
my Regex $atom = / \d ** 2 /;
my Regex $rgx = / (<$atom>) \w+ (<$atom>) /;
$str ~~ $rgx;
请注意,我不匹配/ $rgx /
。那就是把一个正则表达式放在另一个正则表达只需匹配$rgx
。
更好的方法是使用命名的正则表达式。通过以下方式定义atom
和正则表达式,您可以访问匹配组$<atom>[0]
和$<atom>[1]
:
my regex atom { \d ** 2 };
my $rgx = / <atom> \w+ <atom> /;
$str ~~ $rgx;
答案 1 :(得分:4)
关键的观察结果是$str ~~ / $rgx /;
是正则表达式中的正则表达式&#34;。 $rgx
匹配,并在其自己的匹配对象中设置$0
和$1
,但是周围的匹配对象中没有位置存储该信息,所以你无法看到它。也许它的例子清楚,试试这个:
my $str = 'nn12abc34efg';
my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;
$str ~~ / $0=$rgx /;
say $/;
请注意$0
的内容。或者作为另一个例子,让我们给它一个正确的名称:
my $str = 'nn12abc34efg';
my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;
$str ~~ / $<bits-n-pieces>=$rgx /;
say $/;