Perl 6正则表达式变量和捕获组

时间:2017-10-13 08:48:42

标签: perl6

当我使用捕获组制作regex变量时,整个匹配正常,但捕获组为Nil

my $str = 'nn12abc34efg';
my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;

$str ~~ / $rgx / ;
say ~$/;  # 12abc34
say $0;   # Nil
say $1;   # Nil

如果我修改程序以避免$rgx,一切都按预期工作:

my $str = 'nn12abc34efg';

my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;

$str ~~ / ($atom) \w+ ($atom) /;
say ~$/;  # 12abc34
say $0;   # 「12」
say $1;   # 「34」

2 个答案:

答案 0 :(得分:5)

使用您的代码,编译器会发出以下警告:

Regex object coerced to string (please use .gist or .perl to do that)

这告诉我们一些事情是错的 - 正则表达式不应该被视为字符串。嵌套正则表达式还有两种正确的方法。首先,您可以在断言(<>)中包含子正则表达式:

my $str = 'nn12abc34efg';
my Regex $atom = / \d ** 2 /;
my Regex $rgx = / (<$atom>) \w+ (<$atom>) /;
$str ~~ $rgx;

请注意,我不匹配/ $rgx /。那就是把一个正则表达式放在另一个正则表达只需匹配$rgx

更好的方法是使用命名的正则表达式。通过以下方式定义atom和正则表达式,您可以访问匹配组$<atom>[0]$<atom>[1]

my regex atom { \d ** 2 };
my $rgx = / <atom> \w+ <atom> /;
$str ~~ $rgx;

答案 1 :(得分:4)

关键的观察结果是$str ~~ / $rgx /;是正则表达式中的正则表达式&#34;。 $rgx匹配,并在其自己的匹配对象中设置$0$1,但是周围的匹配对象中没有位置存储该信息,所以你无法看到它。也许它的例子清楚,试试这个:

my $str = 'nn12abc34efg';
my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;

$str ~~ / $0=$rgx /;
say $/;

请注意$0的内容。或者作为另一个例子,让我们给它一个正确的名称:

my $str = 'nn12abc34efg';
my $atom = / \d ** 2 /;
my $rgx = / ($atom) \w+ ($atom) /;

$str ~~ / $<bits-n-pieces>=$rgx /;
say $/;