RE2 regexp中如何使用命名的捕获组?

时间:2011-07-13 16:12:16

标签: ruby regex re2

在此页面http://swtch.com/~rsc/regexp/regexp3.html上,它表示RE2支持命名表达式。

  

RE2支持Python风格的命名捕获(?P<name>expr),但不支持   .NET和.NET使用的备用语法(?<name>expr)(?'name'expr)   的Perl。

ruby-1.9.2-p180 :003 > r = RE2::Regexp.compile("(?P<foo>.+) bla")   
#=> #<RE2::Regexp /(?P<foo>.+) bla/>

ruby-1.9.2-p180 :006 > r = r.match("lalal bla")   
#=> #<RE2::MatchData "lalal bla" 1:"lalal">

ruby-1.9.2-p180 :009 > r[1]   #=> "lalal"

ruby-1.9.2-p180 :010 > r[:foo]
TypeError: can't convert Symbol into Integer

ruby-1.9.2-p180 :011 > r["foo"]
TypeError: can't convert String into Integer

但是我无法使用名称访问匹配项,因此它似乎是一个无用的实现。我错过了什么吗?

1 个答案:

答案 0 :(得分:3)

查看您的代码输出,您似乎正在使用我维护的Ruby re2 gem

截至最新版本(0.2.0),gem 不支持基础C++ re2 library's named capturing groups。您看到的错误是由于传递给MatchData#[]的任何非整数参数将被转发到默认Array#[]。你可以在如下的irb会话中确认这一点:

irb(main):001:0> a = [1, 2, 3]
=> [1, 2, 3]
irb(main):002:0> a["bob"]
TypeError: can't convert String into Integer
    from (irb):2:in `[]'
    from (irb):2
    from /Users/mudge/.rbenv/versions/1.9.2-p290/bin/irb:12:in `<main>'
irb(main):003:0> a[:bob]
TypeError: can't convert Symbol into Integer
    from (irb):3:in `[]'
    from (irb):3
    from /Users/mudge/.rbenv/versions/1.9.2-p290/bin/irb:12:in `<main>'

我会尽力添加按名称引用捕获的功能,并在发布后更新此答案。

更新:我刚刚发布了version 0.3.0,它现在支持命名组,如下所示:

irb(main):001:0> r = RE2::Regexp.compile("(?P<foo>.+) bla") 
=> #<RE2::Regexp /(?P<foo>.+) bla/>
irb(main):002:0> r = r.match("lalal bla") 
=> #<RE2::MatchData "lalal bla" 1:"lalal">
irb(main):003:0> r[1]
=> "lalal"
irb(main):004:0> r[:foo]
=> "lalal"
irb(main):005:0> r["foo"]
=> "lalal"